| 일 | 월 | 화 | 수 | 목 | 금 | 토 | 
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 | 
| 9 | 10 | 11 | 12 | 13 | 14 | 15 | 
| 16 | 17 | 18 | 19 | 20 | 21 | 22 | 
| 23 | 24 | 25 | 26 | 27 | 28 | 29 | 
| 30 | 
- linux
 - 데이터시각화
 - 파이썬
 - Perceptron
 - 선형회귀
 - OR게이트
 - 데이터프레임
 - 크롤링
 - 데이터분석
 - 리눅스
 - NAND게이트
 - 머신러닝
 - python
 - 딥러닝
 - pandas
 - numpy
 - 씨본
 - 로지스틱회귀
 - DataFrame
 - XOR게이트
 - seaborn
 - 우분투
 - 달의조각
 - ubuntu
 - AND게이트
 - 비지도학습
 - Deeplearning
 - 데이터크롤링
 - 퍼셉트론
 - 판다스
 
- Today
 
- Total
 
목록pandas (7)
Charming ['ㅡ'] Ham !
데이터 탐색 (EDA)¶ Explorataory Data Analysis 의 줄임말로 데이터를 훑어보는 것을 의미한다. In [3]: # 이탈리아 코로나 현황으로 EDA 연습해보기 # 다운 받을 데이터를 저장할 디렉토리 생성 # 이탈리아 코로나 현황 데이터 다운 # $ wget https://aiffelstaticprd.blob.core.windows.net/media/documents/covid19_italy_region.csv # 생성된 디렉토리에 다운받은 데이터 저장 In [16]: # csv 파일 읽어오기 import pandas as pd import os csv_path = os.getenv("HOME") +"/data_represent/data/covid19_italy_region.csv" ..
Heatmap¶ Heatmap 이란 많은 양의 데이터와 현상을 수치에 따른 색상으로 나타내는 것을 의미한다. 차원에 대한 제한은 없지만 일반적으로 2차원으로 시각화하여 표현한다. 하지만 Heatmap 을 그리기 위해 pivot 을 해야한다. 엑셀의 pivot table 에서의 pivot 과 같은 의미로 사용되며, 데이터를 축, 점을 기준으로 바꾼다는 의미이다. Pandas DataFrame 의 pivot() 메소드를 사용한다. In [18]: # 사용할 패키지 가져오기 import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import os import seaborn as sns 가져올 데이터 주소 $ wget https://aiff..
시계열 데이터 시각화¶ 1. 데이터 가져오기¶ 가져올 데이터 주소 $ wget https://aiffelstaticprd.blob.core.windows.net/media/documents/flights.csv In [26]: # 패키지 가져오기 import os import pandas as pd import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline In [27]: # 데이터 가져오기 csv_path = os.getenv('HOME') + '/data_represent/data/flights.csv' data = pd.read_csv(csv_path) flights = pd.DataFrame(data) flights Out[2..
Visualization, 시각화¶ 시각화를 위해 사용되는 라이브러리는 Matplotlib 와 Seaborn 입니다. 먼저 라이브러리를 설치해 봅시다. $ pip install matplotlib $ pip install seaborn 파이썬에서 시각화는 실제와 크게 다르지 않다. 우선 막대그래프를 먼저 그려봅시다! 그래프를 통한 시각화 순서¶ 아주 간단한 순서로 시각화를 할 수 있다. 그래프에 그릴 데이터들 준비하기 : 항목, 수치 데이터 등 도화지 펴기 : figure 설정 축그리기 : add_subplot() 라벨, 타이틀 달기 보여주기 : plt.show() 1. 막대그래프 그리기¶ In [6]: # 그래프를 그리기 위한 모듈 가져오기 import matplotlib.pyplot as plt # ..
구조화된 데이터¶ 데이터 내부에 자체적인 서브 구조를 가지는 데이터. 테이블(table) 형태로 전개된다. 매핑(mapping), 연관배열(associative array) 라고도 하며, 파이썬에서는 딕셔너리 형태로 {key : value} 의 형태를 말합니다. In [1]: # 딕셔너리 데이터 Country_PhoneNumber = {'Korea': 82, 'America': 1, 'Swiss': 41, 'Italy': 39, 'Japan': 81, 'China': 86, 'Rusia': 7} # 키 값을 통한 데이터 조회 Country_PhoneNumber['Korea'] Out[1]: 82 In [2]: # 게임 플레이어가 상자를 열었을 때 획득 물품을 보여주는 함수 만들어보기 # 상자 속 데이터 ..
csv 파일이 뭔지, 이를 파이썬으로 어떻게 읽고, 쓰는지 알아보자. In [5]: # CSV 는 Comma Seperated Value 의 약자로 쉼표로 구분된 파일 # 데이터들을 쉼표로 구분하는 것이 특징이다. # csv 데이터 형식의 데이터 생성 billboardchart = { 1 : ["Tho Box","Roddy Ricch","2019-12-19"], 2 : ["Don't Start Now", "Dua Lipa", "2019-11-01"], 3 : ["Life Is Good", "Future Featuring Drake", "2020-02-10"], 4 : ["Blinding", "The Weeknd", "2019-11-29"], 5 : ["Circles", "Post Malone","2019..