09:00~21:00 입실/퇴실 체크
Today I Learned 매일 작성
Week I Learned 일요일 작성
[ TIL ]
강의명 : 인공지능을 위한 파이썬 라이브러리
1주차 : 판다스의 기본! 시리즈와 데이터 프레임 개념잡기
오늘은 쥬피터 노트북에 판다스를 설치하고 시리즈와 데이터 프레임을 실행해보았다.
시리즈란?
- 시리즈(Series)는 1차원 배열과 같은 데이터 구조.
- 엑셀의 한 열(column)을 떠올리면 이해가 쉽다.
- 인덱스(Index)와 데이터 값(Value)이 쌍으로 구성된다.
import pandas as pd
# 예시: 시리즈 생성
s = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])
print(s)
# s라는 시리즈는 아래와 같이 출력된다.
a 10
b 20
c 30
d 40
dtype: int64
시리즈의 특징
- 인덱스를 통해 데이터에 빠르게 접근할 수 있다.
- 데이터 타입은 자동으로 설정되지만, 원하는 타입으로 변경 가능.
데이터 프레임(DataFrame)이란?
- 데이터 프레임(DataFrame)은 2차원의 표 형태 데이터 구조.
- 엑셀의 전체 시트(sheet) 같은 느낌.
- 여러 개의 시리즈(Series)가 모여서 만들어진다.
# 예시: 데이터 프레임 생성
data = {
'이름': ['철수', '영희', '민수'],
'나이': [25, 30, 35],
'직업': ['학생', '회사원', '프리랜서']
}
df = pd.DataFrame(data)
print(df)
# df라는 데이터 프레임은 다음과 같이 출력된다.
이름 나이 직업
0 철수 25 학생
1 영희 30 회사원
2 민수 35 프리랜서
데이터 프레임의 특징
- 행(row)과 열(column)로 구성된 2차원 데이터.
- 다양한 데이터 타입을 각 열에 담을 수 있다.
- 인덱스와 컬럼명을 사용해 특정 데이터에 접근할 수 있다.
시리즈와 데이터 프레임의 공통점, 차이점
시리즈 | 데이터 프레임 | |
공통점 | 둘 다 인덱스를 가지고 있어 데이터에 쉽게 접근 가능. | |
판다스에서 가장 기본적인 데이터 구조. | ||
차이점 | 1차원 | 2차원 |
하나의 데이터 타입 | 다양한 데이터 타입 허용 |
[오늘 목표와 달성도]
오늘 목표 달성 완료!