2024/09/18 3

DAY 07. 데이터프레임 탐색

2. 데이터프레임 탐색# 라이브러리 불러오기import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns# 데이터 읽어오기path = 'csv파일 url'tip = pd.read_csv(path)# 확인tip.head()예시) [참고] 익숙해져야 할 기능 목록head(): 상위 데이터 확인tail(): 하위 데이터 확인shape: 데이터프레임 크기index: 인덱스 정보 확인values: 값 정보 확인columns: 열 정보 확인dtypes: 열 자료형 확인info(): 열에 대한 상세한 정보 확인describe(): 기술통계정보 확인2.1. 앞, 뒤 일부 데이터, 크기 확인head(n), tail(n) 메..

DAY 07. 데이터프레임 생성

1. 데이터프레임 생성1.1. 데이터프레임 이해1.1.1. 데이터프레임이란Pandas의 주 사용 목적이 데이터프레임을 사용하기 위한 것데이터를 처리, 조회, 분석하는 가장 효율적인 방법이 바로 데이터프레임을 사용하는 것일반적으로 접하게 되는 테이블 형태, 엑셀 형태와 같음직접 만들 수 있으나 보통은 csv 파일, 엑셀 파일 또는 DB에서 읽어옴데이터프레임 형태로 저장해 처리(변경또는 분석 등) 해야함(리스트나 딕셔너리 또는 배열 형태로는 저장 불가)1.1.2. 데이터프레임 형태데이터프레임은 인덱스(=행 이름)와 열 이름이 있고 없고에 따라 다른 형태를 가짐인덱스란 행을 특정지어 조회할 때, 열 이름은 열을 특정지어 조회할 때 사용하는 정보1) 인덱스와 열 이름이 없는 형태열 이름이 없는 데이터프레임은 사..

DAY 07. 넘파이 기초

1. 라이브러리 불러오기Numpy 배열을 사용하려면 우선 numpy 라이브러리를 불러와야 합니다.numpy 라이브러리는 일반적으로 np 별칭을 붙여 불러옵니다.# 라이브러리 불러오기import numpy as np 2. 배열 만들기데이터 처리시 배열로 변환해 연산을 하거나, 결과가 배열로 표시되는 경우가 있음2.1. 용어 정의[용어]axis: 배열의 각 축rank: 축의 개수shape: 축의 길이, 배열의 크기[3 x 4 배열의 경우]axis 0 과 axis 1 을 갖는 2차원 배열rank 2 arrayshape는 (3, 4)2.2. 배열 만들기np.array() 함수를 사용해서 배열을 만듭니다.대부분 리스트로부터 배열을 만들거나, 머신러닝 관련 함수 결괏값이 배열이 됩니다.2.2.1. 배열 만들기1) ..