본문 바로가기

전체 글349

이산변수 / 박스 그래프 그리기 □ 박스 그래프 : 이산변수와 연속변수 사이의 관계를 나타냄 ○ 이산 변수 : 명확하게 구분이되는 값을 의미 ○ 연속형 변수 : 명확하게 셀수 없는 범위의 값을 의미 #라이브러리 호출 import seaborn as sns import matplotlib.pyplot as plt tips = sns.load_dataset('tips') #틀생성 boxplot = plt.figure() #시각화 위치 및 범위 지정 axes1 = boxplot.add_subplot(1,1,1) #데이터 지정 axes1.boxplot( x=[ tips[tips['sex'] == 'Female']['tip'], tips[tips['sex'] == 'Male']['tip'] ], labels=['Female','Male']) #.. 2024. 2. 6.
일변량 / 이변량 시각화 □ 일변량 ○ 변수가 1개일 때 이를 일변량 ○ 하나의 변수를 시각화하는 가장 일반적 방법 ○ 값을 일정 구간별로 묶어서 해당 구간의 데이터 개수를 빈도로 표시하는 그래프로 변수의 분포를 나타냄 * bins : x축 구간의 막대 표시 개수를 의미함 #라이브러리 호출 import seaborn as sns import matplotlib.pyplot as plt tips = sns.load_dataset('tips') fig = plt.figure() #틀생성 axes1 = fig.add_subplot(1,1,1) #위치 및 순서 지정 axes1.hist(data = tips, x='total_bill', bins = 10) axes1.set_title('histogram of Total Bill') #대.. 2024. 2. 6.
한번에 4개 그래프 그리기 □ 순서 ○ 데이터 불러오기 및 셋 구축 ○ 틀 생성 plt.figure() ○ 데이터 시각화 배치 #데이터셋 필드의 값이 I 인것으로 설정 dataset_1 = anscombe[anscombe['dataset'] == 'I'] dataset_2 = anscombe[anscombe['dataset'] == 'II'] dataset_3 = anscombe[anscombe['dataset'] == 'III'] dataset_4 = anscombe[anscombe['dataset'] == 'IV'] #기본틀 생성 fig = plt.figure() fig.suptitle('Visual Data') #그림판 대제목 fig.set_tight_layout('True') #그래프와 소제목 겹치지않도록 간격 생성 #2*.. 2024. 2. 6.
파이플롯(pyplot) 시각화 □ 데이터 셋 지정 #데이터 불러오기 anscombe = sns.load_dataset('anscombe') #데이터셋 필드의 값이 I 인것으로 설정 dataset_1 = anscombe[anscombe['dataset'] == 'I'] □ plot 차트 생성 및 라인색상 지정 #데이터셋 중 x필드와 y필드로 plot 차트 생성 및 색상 blue추가 plt.plot(dataset_1['x'], dataset_1['y'], c='b') □ plot 차트 생성 및 라인 굵기 지정 plt.plot(dataset_1['x'], dataset_1['y'], c='b', lw = 5) #선 굵기 추가 □ plot 차트 생성 및 라인 스타일 점선 지정 plt.plot(dataset_1['x'], dataset_1['.. 2024. 2. 6.
다음 뉴스(제목, 링크, 회사, 카테고리) 크롤링 □ 크롤링 대상 ○ 언론사 ○ 카테고리 ○ 기사제목 ○ 기사제목 안에 있는 상세페이지 링크 주소 #라이브러리 호출 import requests from bs4 import BeautifulSoup #크롤링 사이트 설정 target_url = 'https://news.daum.net/' #데이터 request 및 get. get한 데이터를 html.paser로 분리 req_data_area = requests.get(target_url, headers = headers) html_raw_data = req_data_area.text #해당영역에 있는 모든 텍스트 데이터 저장 html_raw_data_parsing = BeautifulSoup(html_raw_data, 'html.parser') #클래스 이.. 2024. 2. 5.
판다스 : 시리즈 □ 시리즈는 1차원 데이터, 데이터프레임은 2차원 데이터 형태로 구성됨 □ 시리즈 생성 ○ 인덱스란 행의 레이블을 의미함. 별도 지정안하면 인덱스는 0부터 자동생성됨 #시리즈 생성 : 인덱스 무 seriesdt = pd.Series([10,20,30,40,50]) #시리즈 생성 : 인덱스 유 #인덱스는 행의 레이블을 의미함. 별도 지정안하면 인덱스는 0부터 자동생성됨 seriesdt_index = pd.Series([10,20,30,40,50], index = ['국어','영어','수학','국사','세계사']) □ 인덱스 조회 #인덱스 확인 seriesdt_index.index print(seriesdt_index.index) □ 인덱스 수정 seriesdt_index.index = ['영어','한문',.. 2024. 2. 4.
장고란?(feat.MTV모델) □ 마감시간이 있는 완벽주의자를 위한 웹프레임워크 □ 바퀴를 다시발명하지마라 ○ 초기 학습비용은 있지만 매번 새롭게 바퀴를 재발명 안함 ○ 장고라는 바퀴를 잘굴려 빠르고 정확하게 동작하는 에플리케이션 개발 ○ 백엔드 개발에 필요한 거의 모든 기능을 장고중심으로 제공 □ 시간은 가장 큰비용으로!! 장고를 누리고 시간을 아껴라 ○ 고유한 개념 및 데이터는 한곳에, 하나만 조재 ○ 중복 X, 정규화 OK ○ 장고를 통해 중복없는 고유한 개념/데이터로 최대한의 기능을 만듬 □ 신속한 개발 추구 ○ 느슨한 결합 탄탄한 응집 ○ 프레임워크의 각 계층은 필요하기전에는 서로 결합이 없어야함, Best Practice 제안구현은 있지만 강제는 아님 □ 적은코드 / 반복하지 않음 ○ 중복줄이고 정규화 지향 ○ 명시적인 묵.. 2024. 2. 4.
(서울시 서대문구) 신촌 고기 맛집 ○ 신소살 (1) 맛 : ☆☆☆☆☆(강추 및 생각날것 같음) (2) 친절도 및 서비스(사장 및 종업원 포함) : ☆☆☆☆(힘들텐데 친절하게 해줘서 고마워.) ※ 가성비 가격대비 최고 ※ 신촌에 위치한 고기집치고 조용하고 깔끔해서 너무 인상적이었음 ※ 고기 퀄리티도 맛도 최상급. 이곳은 분명히 조만간 신촌맛집으로 뜰것 같다고 생각함 2024. 2. 3.
(서울시 은평구) 장칼국수 맛집 ○ 양양감자칼국수 (1) 맛 : ☆☆☆☆☆(강추 및 생각날것 같음) (2) 친절도 및 서비스(사장 및 종업원 포함) : ☆☆☆☆(힘들텐데 친절하게 해줘서 고마워.) ※ 서울에서 강원도 또는 속초안가고 리얼본연의 장칼국수 맛을 느낄 수 있어 너무 신났음 ※ 반찬도 무채, 김치로 나오는 데 너무 맛있었음 ※ 사장님께서는 활발하시고 유쾌하신것 같아 기분좋게 식사할 수 있었음 2024. 2. 3.