2024.11.25 TIL(AI 9기 - 본캠프 시작)

09:00~21:00 입실/퇴실 체크

Today I Learned 매일 작성

Week I Learned 일요일 작성

우리조 스터디 계획

 

[ TIL ]

강의명 : 인공지능을 위한 파이썬 라이브러리

1주차 : 판다스의 기본! 시리즈와 데이터 프레임 개념잡기

오늘은 쥬피터 노트북에 판다스를 설치하고 시리즈와 데이터 프레임을 실행해보았다.

 

강의 내용 실행 화면

 

시리즈란?

  • 시리즈(Series)는 1차원 배열과 같은 데이터 구조.
  • 엑셀의 한 열(column)을 떠올리면 이해가 쉽다.
  • 인덱스(Index)와 데이터 값(Value)이 쌍으로 구성된다.
import pandas as pd

# 예시: 시리즈 생성
s = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])
print(s)


# s라는 시리즈는 아래와 같이 출력된다.
a    10
b    20
c    30
d    40
dtype: int64

 

시리즈의 특징

  • 인덱스를 통해 데이터에 빠르게 접근할 수 있다.
  • 데이터 타입은 자동으로 설정되지만, 원하는 타입으로 변경 가능.

 

 

데이터 프레임(DataFrame)이란?

  • 데이터 프레임(DataFrame)은 2차원의 표 형태 데이터 구조.
  • 엑셀의 전체 시트(sheet) 같은 느낌.
  • 여러 개의 시리즈(Series)가 모여서 만들어진다.
# 예시: 데이터 프레임 생성
data = {
    '이름': ['철수', '영희', '민수'],
    '나이': [25, 30, 35],
    '직업': ['학생', '회사원', '프리랜서']
}

df = pd.DataFrame(data)
print(df)


# df라는 데이터 프레임은 다음과 같이 출력된다.
   이름  나이     직업
0  철수  25     학생
1  영희  30    회사원
2  민수  35  프리랜서

 

 

데이터 프레임의 특징

  • 행(row)과 열(column)로 구성된 2차원 데이터.
  • 다양한 데이터 타입을 각 열에 담을 수 있다.
  • 인덱스와 컬럼명을 사용해 특정 데이터에 접근할 수 있다.

 

시리즈와 데이터 프레임의 공통점, 차이점

  시리즈 데이터 프레임
공통점 둘 다 인덱스를 가지고 있어 데이터에 쉽게 접근 가능.
판다스에서 가장 기본적인 데이터 구조.
차이점 1차원 2차원
하나의 데이터 타입 다양한 데이터 타입 허용

 

 

 

 

[오늘 목표와 달성도]

오늘 목표 달성 완료!