2024/09 10

DAY 08. 데이터프레임 조회

데이터프레임을 대상으로 조회하는 방법은 다양하지만, 그 중 한 가지 방법을 선택해 일관되게 사용하는 것이 좋다.※ 라이브러리 호출: 데이터프레임 작업 시엔 무조건 해준다.# 라이브러리 불러오기import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns 3.1. 데이터 읽어오기# 데이터 읽어오기path = 'csv파일 url'tip = pd.read_csv(path)# 확인# tip[:5]tip.head()예시)※ shape, info(), describe() 등을 활용해 데이터를 잘 불러왔는지 꼭 확인해본다. 3.2. 특정 열 조회df.loc[ : , [열 이름1, 열 이름2,...]] 형태로 조회할 열 ..

DAY 07. 데이터프레임 탐색

2. 데이터프레임 탐색# 라이브러리 불러오기import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns# 데이터 읽어오기path = 'csv파일 url'tip = pd.read_csv(path)# 확인tip.head()예시) [참고] 익숙해져야 할 기능 목록head(): 상위 데이터 확인tail(): 하위 데이터 확인shape: 데이터프레임 크기index: 인덱스 정보 확인values: 값 정보 확인columns: 열 정보 확인dtypes: 열 자료형 확인info(): 열에 대한 상세한 정보 확인describe(): 기술통계정보 확인2.1. 앞, 뒤 일부 데이터, 크기 확인head(n), tail(n) 메..

DAY 07. 데이터프레임 생성

1. 데이터프레임 생성1.1. 데이터프레임 이해1.1.1. 데이터프레임이란Pandas의 주 사용 목적이 데이터프레임을 사용하기 위한 것데이터를 처리, 조회, 분석하는 가장 효율적인 방법이 바로 데이터프레임을 사용하는 것일반적으로 접하게 되는 테이블 형태, 엑셀 형태와 같음직접 만들 수 있으나 보통은 csv 파일, 엑셀 파일 또는 DB에서 읽어옴데이터프레임 형태로 저장해 처리(변경또는 분석 등) 해야함(리스트나 딕셔너리 또는 배열 형태로는 저장 불가)1.1.2. 데이터프레임 형태데이터프레임은 인덱스(=행 이름)와 열 이름이 있고 없고에 따라 다른 형태를 가짐인덱스란 행을 특정지어 조회할 때, 열 이름은 열을 특정지어 조회할 때 사용하는 정보1) 인덱스와 열 이름이 없는 형태열 이름이 없는 데이터프레임은 사..

DAY 07. 넘파이 기초

1. 라이브러리 불러오기Numpy 배열을 사용하려면 우선 numpy 라이브러리를 불러와야 합니다.numpy 라이브러리는 일반적으로 np 별칭을 붙여 불러옵니다.# 라이브러리 불러오기import numpy as np 2. 배열 만들기데이터 처리시 배열로 변환해 연산을 하거나, 결과가 배열로 표시되는 경우가 있음2.1. 용어 정의[용어]axis: 배열의 각 축rank: 축의 개수shape: 축의 길이, 배열의 크기[3 x 4 배열의 경우]axis 0 과 axis 1 을 갖는 2차원 배열rank 2 arrayshape는 (3, 4)2.2. 배열 만들기np.array() 함수를 사용해서 배열을 만듭니다.대부분 리스트로부터 배열을 만들거나, 머신러닝 관련 함수 결괏값이 배열이 됩니다.2.2.1. 배열 만들기1) ..

DAY 05. 함수

8. 함수함수는 입력을 받아 무엇인가를 처리한 후 그 결과를 반환하는 것같은 입력이라도 함수의 기능에 따라 다른 출력이 나올 수 있다.함수는 def 문으로 정의하며, 기본적으로 세 가지로 구성됨입력(Input)- 매개변수, 생략가능처리- 코드출력(Output)- 처리 결과, 생략가능8.1. 입력※ 입력 없이 처리되는 함수[처리하는 함수]# 함수 만들기: 처리하는 함수def hello(): print('안녕하세요? 반갑습니다!')# 함수 사용하기hello()---# 출력# 안녕하세요? 반갑습니다!→ 반환하는 것이 없으므로 a = hello() 후 print(a)를 하면 None이 출력된다. [반환하는 함수]# 함수 만들기: 반환하는 함수def hello(): return '안녕하세요? 반갑습니다..

DAY 04. 제어문

7. 제어문조건 처리나 반복 처리를 통해 코드의 실행 흐름을 제어할 수 있음Python 제어문은 들여쓰기로 블럭을 지정하니 이에 필히 주의7.1. if 문특정 조건에 맞는 경우에만 코드를 실행하고 싶을 때 사용1) 단순 if 문조건이 참인 경우만 처리조건이 거짓인 경우는 아무 처리도 하지 않음# 리스트 만들기score_list = [75, 80, 70, 95, 90]# 리스트에 요소가 있으면 출력, 없으면 말고if len(score_list) > 0: # 요소의 유무 여부는 리스트의 길이인 len() 메서드를 활용하는 것이 간편하다. print(score_list)---# 출력# [75, 80, 70, 95, 90] 2) if ~ else 문조건이 참인 경우와 참이 아닌 경우를 각각 처리함# 리스..

DAY 03. 딕셔너리 자료형

6. 딕셔너리 자료형딕셔너리는 집합과 마찬가지로 중괄호({ }) 를 사용해 선언하지만 {Key1: Value1, Key2: Value2, Key3: Value3}의 형태를 가지므로 집합과 구분됨딕셔너리는 순서의 의미가 없으며, 키(Key)를 사용해 값(Value)을 확인리스트와 더불어 많이 사용되는 자료형6.1. 딕셔너리 만들기6.1.1. 딕셔너리 직접 만들기1) 일정한 정보를 갖는 딕셔너리다음과 같이 요소를 아래로 나열하면 가독성이 좋아짐# 이름:점수score = {'홍길동': 100, '한여인': 90, '일지매': 90}# 확인score---{'홍길동': 100, '한여인': 90, '일지매': 90} 2) 다양한 정보를 갖는 딕셔너리리스트나 튜플을 Value로 가질 수..

DAY 03. 집합 자료형

5. 집합 자료형집합 연산(교집합, 합집합, 차집합, 대칭 차집합)을 위한 자료형중복을 허용하지 않아 중복된 원소는 하나만 제외하고 모두 무시됨원소의 순서가 의미가 없으므로 인덱싱과 슬라이싱으로 값을 얻을 수 없음5.1. 집합 만들기5.1.1. 집합 직접 만들기1) 정수를 갖는 집합# 정수를 갖는 집합nums = {1, 2, 3, 4, 5}# 확인nums---{1, 2, 3, 4, 5} 2) 문자열을 갖는 집합# 문자열을 갖는 집합members = {'홍길동', '일지매', '한사랑'}# 확인members---{'일지매', '한사랑', '홍길동'}→ 출력을 통해 순서에 의미가 없음을 확인할 수 있다. 5.1.2. 집합으로 자료형 변환set() 함수를 사용해 다른 자료형을 집합으로 변환1) 문자열 → 집합..

DAY 03. 튜플 자료형

4. 튜플 자료형4.1. 튜플 자료형의 특성튜플은 대괄호([ ])가 아닌 소괄호(( ))를 사용해서 표현함튜플은 한 번 만들면 요소의 값을 바꿀 수 없음이 리스트와 다름단, 괄호를 생략할 수 있다는 점은 리스트와 다름리스트에서는 대괄호를 생략할 수 없음그 외는 리스트와 같은 특성을 가짐인덱싱 및 슬라이싱을 리스트와 같은 방법으로 사용 가능4.1.1. 다양한 튜플 만들기1) 빈 튜플 만들기# 빈 튜플 만들기 #1score = ()# 확인score----------()# 빈 튜플 만들기 #2score = tuple()# 확인score----------() 2) 요소가 하나인 튜플 만들기# 튜플을 잘못 만든 예score = (90)# 확인print(score)print(type(score))---90→ 튜플이..

DAY 02. 리스트 자료형

리스트는 여러 값을 묶어서 갖는 컨테이너 자료형 중의 하나대괄호([ ]) 안에 콤마로 구분해 값을 나열하며, 이 값을 요소라고 부름이 세상 온갖 데이터(숫자, 문자, 파일, 이미지 등등)가 리스트의 요소가 될 수 있음리스트도 리스트의 요소가 될 수도 있음Python에서 가장 많이 사용되는 자료형이 리스트라고 생각해도 됨 1. 일반 변수와 리스트 비교1) 일반 변수 - 처리할 데이터 수가 많을수록 번거로움# 개별 값을 갖는 기존 변수score1 = 85score2 = 90score3 = 80score4 = 75score5 = 95# 변수들의 합score_sum = score1 + score2 + score3 + score4 + score5# 확인score_sum----------425 2) 리스트 - 많은..