일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- python
- 달의조각
- seaborn
- OR게이트
- NAND게이트
- Perceptron
- 데이터크롤링
- ubuntu
- Deeplearning
- 로지스틱회귀
- 딥러닝
- pandas
- 머신러닝
- 리눅스
- XOR게이트
- 씨본
- 크롤링
- 우분투
- DataFrame
- 파이썬
- AND게이트
- 판다스
- 퍼셉트론
- 비지도학습
- numpy
- 선형회귀
- 데이터시각화
- linux
- 데이터프레임
- 데이터분석
- Today
- Total
목록지식 정보 공유/코딩 : Coding (12)
Charming ['ㅡ'] Ham !
Numpy¶ Numpy 는 Numerical python 의 줄임말로, 수학적 계산을 간단하게 만들어줄 수 있는 패키지로 주로 과학계산용, 데이터 분석에서 많이 사용된다. In [7]: # 넘파이 설치 # $ pip install numpy # ndarray 만들기 # 넘파이 사용을 위한 넘파이 패키지 가져오기 import numpy as np # 다양한 array 의 형태 A = np.arange(5) B = np.array([0, 1, 2, 3, 4]) # 문자열 array # array 는 모든 요소의 타입이 동일해야한다. # 또한 str 을 int 로 바꿀순 없지만 반대는 가능하다. # 따라서 모든 숫자를 문자로 바꿔버림, 요소의 형태에 주의할 것. C = np.array([0, 1, 2, 3, ..
데이터 탐색 (EDA)¶ Explorataory Data Analysis 의 줄임말로 데이터를 훑어보는 것을 의미한다. In [3]: # 이탈리아 코로나 현황으로 EDA 연습해보기 # 다운 받을 데이터를 저장할 디렉토리 생성 # 이탈리아 코로나 현황 데이터 다운 # $ wget https://aiffelstaticprd.blob.core.windows.net/media/documents/covid19_italy_region.csv # 생성된 디렉토리에 다운받은 데이터 저장 In [16]: # csv 파일 읽어오기 import pandas as pd import os csv_path = os.getenv("HOME") +"/data_represent/data/covid19_italy_region.csv" ..
Heatmap¶ Heatmap 이란 많은 양의 데이터와 현상을 수치에 따른 색상으로 나타내는 것을 의미한다. 차원에 대한 제한은 없지만 일반적으로 2차원으로 시각화하여 표현한다. 하지만 Heatmap 을 그리기 위해 pivot 을 해야한다. 엑셀의 pivot table 에서의 pivot 과 같은 의미로 사용되며, 데이터를 축, 점을 기준으로 바꾼다는 의미이다. Pandas DataFrame 의 pivot() 메소드를 사용한다. In [18]: # 사용할 패키지 가져오기 import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import os import seaborn as sns 가져올 데이터 주소 $ wget https://aiff..
시계열 데이터 시각화¶ 1. 데이터 가져오기¶ 가져올 데이터 주소 $ wget https://aiffelstaticprd.blob.core.windows.net/media/documents/flights.csv In [26]: # 패키지 가져오기 import os import pandas as pd import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline In [27]: # 데이터 가져오기 csv_path = os.getenv('HOME') + '/data_represent/data/flights.csv' data = pd.read_csv(csv_path) flights = pd.DataFrame(data) flights Out[2..
Visualization, 시각화¶ 시각화를 위해 사용되는 라이브러리는 Matplotlib 와 Seaborn 입니다. 먼저 라이브러리를 설치해 봅시다. $ pip install matplotlib $ pip install seaborn 파이썬에서 시각화는 실제와 크게 다르지 않다. 우선 막대그래프를 먼저 그려봅시다! 그래프를 통한 시각화 순서¶ 아주 간단한 순서로 시각화를 할 수 있다. 그래프에 그릴 데이터들 준비하기 : 항목, 수치 데이터 등 도화지 펴기 : figure 설정 축그리기 : add_subplot() 라벨, 타이틀 달기 보여주기 : plt.show() 1. 막대그래프 그리기¶ In [6]: # 그래프를 그리기 위한 모듈 가져오기 import matplotlib.pyplot as plt # ..
구조화된 데이터¶ 데이터 내부에 자체적인 서브 구조를 가지는 데이터. 테이블(table) 형태로 전개된다. 매핑(mapping), 연관배열(associative array) 라고도 하며, 파이썬에서는 딕셔너리 형태로 {key : value} 의 형태를 말합니다. In [1]: # 딕셔너리 데이터 Country_PhoneNumber = {'Korea': 82, 'America': 1, 'Swiss': 41, 'Italy': 39, 'Japan': 81, 'China': 86, 'Rusia': 7} # 키 값을 통한 데이터 조회 Country_PhoneNumber['Korea'] Out[1]: 82 In [2]: # 게임 플레이어가 상자를 열었을 때 획득 물품을 보여주는 함수 만들어보기 # 상자 속 데이터 ..