본문 바로가기

전체 글

(116)
Python - 시각화, 그래프(plot) ### pandas에서 시각화 import pandas as pd df = pd.read_excel\ ('./남북한발전전력량.xlsx',engine='openpyxl') # .은 현재폴더 의미 없어도 됨 print(df.head()) # 0행과 5행의 정보만 1990년 이후 데이터만 가져오기 2열 이후 정보만 저장 ndf = df.iloc[[0,5],2:] print(ndf) # 인덱스 변경하기 [0,5] -> ['South','North'] ndf.index=["South","North"] print(ndf) # 열의 이름을 정수형으로 변경하기 ndf.columns = ndf.columns.map(int) print(ndf.head()) # 선그래프 출력하기 ndf.plot() # 열별로 선 그래프가 ..
Python - json 파일 읽기 # json 파일 읽기 # csv : , 기준으로 데이터 분리 저장 # excel: 이진 파일, 메모장에서 볼 수 없음. 유틸리티 필요함 # => 컬럼 기준으로 데이터의 의미부여 # 단어 자체에 의미 부여 : 홍길동, 80, A, 170 # xml 문서로 저장 # 홍길동80A170 # json 문서로 저장 #텍스트 문서임 ''' { "이름":'홍길동', "몸무게":80, "학점":"A", "키":170 } ''' ### json 형태의 파일 읽기 df3 = pd.read_json("read_json_sample.json") df3 ### json 데이터 연습 import json price = { "date" : "2021-02-17", "price" :{ "Apple":800, "Orange":1000..
Python - 판다스 xlsx 불러오기, 저장하기 연습문제 (infile,outfile) ''' 1. sales_2015.xlsx 파일의 january_2013 sheet의 중 "Customer Name", "Sale Amount" 컬럼만 sales_2015_amt.xlsx 파일로 저장하기 2. sales_2015.xlsx 파일의 모든 sheet의 "Customer Name", "Sale Amount" 컬럼만 sales_2015_allamt.xlsx 파일로 저장하기 ''' ​ # 1 import pandas as pd infile = "sales_2015.xlsx" outfile = "sales_2015_amt.xlsx" df = pd.read_excel(infile,"january_2015",index_col=None) df_value = df[["Customer Name","Sale Am..
Python - 판다스 기초, 데이터프레임(대표값, 데이터프레임복사, 행/열 삭제) # 판다스의 series 데이터셋 # dictionary를 Series 데이터로 저장하기 import pandas as pd dict_data = {'a':1,'b':2,'c':3} sr = pd.Series(dict_data) print(type(sr)) print(sr) print(sr.index) print(sr.values) # 리스트를 시리즈 데이터로 저장 list_data = ['2019-01-02', 3.14, 'ABC', 100, True] sr = pd.Series(list_data) print(sr) print(sr.index) print(sr.values) # tuple을 시리즈 데이터로 저장 tup_data = ('길동',"1990-01-01","남자",True) sr = pd.Se..
Python - xlsx,xls 파일 읽기 [openpyxl, pandas] # xLsx 파일 읽기 : pip install openpyxl # xLs import openpyxl # xlsx 형식의 엑셀파일을 읽기 위한 filename = "sales_2015.xlsx" # 엑셀 파일의 내용 book = openpyxl.load_workbook(filename) sheet = book.worksheets[0] data=[] # 모든 데이터 정보를 리스트로 저장 # 리스트로 한행의 정보를 저장. 한 행의 정보를 # 리스트로 저장 # sheet.rows : 행의 값들 # row : 한개의 행 정보 저장 for row in sheet.rows : line = [] #한 행의 셀의 값들을 리스트 저장 #enumerate : 리스트에서 데이터와 index 값을 제공 for l,d in ..
Python - Database 연습문제 ''' 1. select 구문을 입력하고 다음과 같은 결과가 출력되도록 프로그램을 작성하시오 [결과] sql 입력하세요========= select * from dept 조회 레코드수: 4 ,조회 컬럼수:3 (10, 'ACCOUNTING', 'NEW YORK') (20, 'RESEARCH', 'DALLAS') (30, 'SALES', 'CHICAGO') (40, 'OPERATIONS', 'BOSTON') sql 입력하세요========= select studno,name from student where grade = 1 조회 레코드수: 5 ,조회 컬럼수:2 (9711, '이윤나') (9712, '안은수') (9713, '인영민') (9714, '김주현') (9715, '허우') ​ sql 입력하세요==..
[로지스틱 회귀분석] Students' Academic Performance Dataset # 주제 : 데이터로 살펴보는 학생의 학습 성공/실패 요소 ## 실습 가이드 1. 데이터를 다운로드하여 Colab에 불러옵니다. 2. 필요한 라이브러리는 모두 코드로 작성되어 있습니다. 3. 코드는 위에서부터 아래로 순서대로 실행합니다. ## 데이터 소개 - 이번 주제는 xAPI-Edu-Data 데이터셋을 사용합니다. - 다음 1개의 csv 파일을 사용합니다. xAPI-Edu-Data.csv - 각 파일의 컬럼은 아래와 같습니다. gender: 학생의 성별 (M: 남성, F: 여성) NationaliTy: 학생의 국적 PlaceofBirth: 학생이 태어난 국가 StageID: 학생이 다니는 학교 (초,중,고) GradeID: 학생이 속한 성적 등급 SectionID: 학생이 속한 반 이름 Topic: ..
Python - Database ### db에 데이터 처리하기 # sqlite db 사용하기 # sqlite : 파이썬 내부에 존재하는 dbms import sqlite3 dbpath = "test.sqlite" #데이터베이스파일 conn = sqlite3.connect(dbpath) #dbpath파일에 데이터 저장 cur = conn.cursor() #sql구문 실행하기 위한 객체 #executescript : 여러개의 문장을 실 cur.executescript(''' drop table if exists items; create table items (item_id integer primary key, name text unique, price integer); insert into items (name,price) values (..