목록연습문제 (27)
Learn & Record

1. Pandas 데이터 그룹핑 - 데이터 그룹핑은 데이터를 특정한 값에 기반해 묶는 기능으로 groupby()를 사용하여 통계량을 요약할 수 있음 - 통계량에 관계된 메서드에는 mean(평균), std(표준편차), var(분산), max(최대값), min(최소값) 등이 있음 import pandas as pd # 한 열을 기준으로 그룹화하기 s1 = pd.read_excel('./input/nation.xlsx') print(s1) # 국적코드 성별 입국객수 증가수 # 0 A01 남성 125000 8000 # 1 A01 여성 130000 10000 # 2 A05 남성 300 10 # 3 A05 여성 200 50 # 4 A06 남성 158912 24486 # 5 A06 여성 325000 63466 pri..
1. 연습문제 import requests from bs4 import BeautifulSoup as bs # BeautifulSoup 실습 : find_all() 메소드 이용하기 # 다음 뉴스에서 제목, 링크, 뉴스 본문 추출하기 # 다음 뉴스에서 제목, 링크, 뉴스 본문 추출해서 파일로 저장하기 # 1) 이전 예제를 활용할 것 # 2) 링크를 추출한 for 안에서 제목을 추출 # 3) 뉴스 본문은 링크를 이용 # 4) 링크를 타고 뉴스 본문을 들고 와야 되니 # for문 안에서 requests, BeautifulSoup가 실행이 되어야 함 # 5) 제목, 링크, 뉴스 순으로 csv 저장 # 기사 모으기 url = 'https://news.daum.net/' response = requests.get(..
1. CSV - 쉼표로 구분된 값 comma # CSV 파일 입출력 # 1. CSV 파일이란 # 쉼표로 구분된 값 comma-separated values를 의미 # 일반 텍스트 파일처럼 저장된 간단한 스프레드 시트 # 파이썬의 csv 모듈로 CSV 파일을 쉽게 구문 분석 가능 # 각 줄은 스프레드 시트의 행을 의미하고, 쉼표는 행에서 셀을 구분하는 용도로 사용 # * 단점 # 값에 유형이 없음. 모든 것은 다 문자열 # 글꼴 크기나 색상을 지정할 수 없음 # 여러 개의 워크시르틀 가질 수 없음 # 셀의 너비나 높이를 지정할 수 없음 # 셀을 병합할 수 없음 # 그림이나 차트를 포함 할 수 없음 # Comma Separated Values 의 약자로, '쉼표로 분리한 값들' # db나 스프레드시트 데이터..
1. 클래스 # 3. 클래스 정의 # 클래스 정의 방법 # 1) class 키워드로 클래스를 정의 # 2) 클래스 이름은 Upper Camel Case 규칙을 따름 # 파이썬은 변수나 함수의 이름을 네이밍할 때 언더바 (_)를 이용해 단어를 연결하는 Snake Case 방식을 사용하지만 # 클래스는 Upper Camel Case 규칙을 따름 # print + member : printmember 1) print_member 2) printMember 3) PrintMember # 클래스는 다음과 같은 형식으로 정의 # class 클래스 : # 본문 # 4. 객체 생성 # 클래스가 정의되었다면 다음과 같은 형식으로 객체를 생성 # 객체 = 클래스() # 2개의 객체를 만들고 싶으면 # 객체1 = 클래스()..
1. 메소드 - 메소드 method란 특정 객체 object가 가지고 있는 함수 function을 의미 - 함수는 독립적으로 호출할 수 있지만, 메소드는 특정 객체를 통해서만 호출할 수 있음 - 함수와 다르게 메소드는 특정 객체 소속이어서, 메소드를 호출하려면 - 특정 객체를 통해서만 호출 가능 # 1. 문자열 메소드 # 문자열 str을 처리하기 위해 많은 메소드를 제공 # 1) format() # 정렬 옵션 # : 지정된 공간 내에서 오른쪽 정렬 # ^ : 지정된 공간 내에서 가운데 정렬 # 10d는 10자리의 필드 폭을 의미 print("10자리 폭 왼쪽 정렬 '{:>> ') if p.find('-') != 6: # 문자열 내부에 포함된 특정 문자열을 찾고..