시리즈(예정) |
1. Pykrx 패키지로 주식 상승폭이 큰 날짜 확인하기 |
2. 크롤링을 위해 네이버 뉴스 URL 받아오기 |
3. 크롤링 하고 헤드라인 추출하기 |
요즘 주식을 잘 하고 있지는 않지만, 2020년 주식 붐일 때 사놓은 주식들이 있었다. 이 때 주식이 블랙핑크 컴백의 기대감에 엄청 오르다가 컴백 하자마자 뚝 떨어지는거 보고 '이거 뭐지?'하는 의구심을 가졌다. 그때 알았다. 주식은 성과 자체보다 실현 전 기대감이 클 때 더 많이 오른다는 것을.. 이것이 실제로 맞는지 배워둔 Python과 Pandas 등을 통해서 알아보기로 하였다.
1. 패키지 받기
#패키지 설치
!pip install pykrx
#주식
from pykrx import stock
#데이터 분석
import pandas as pd
#데이터 시각화
import matplotlib.pyplot as plt
#크롤링
import requests
from bs4 import BeautifulSoup #HTML
import json
import re #정규표현식
엄청나게 많은 패키지가 필요했다.
주식 폭만 확인할 것이라면 #데이터 시각화와 #크롤링 패키지는 받지 않아도 된다.
나는 워드 클라우드까지 이용했지만, 이는 추후 패키지를 다운 받을 예정이다.
1. Pykrx 패키지 Github
https://github.com/sharebook-kr/pykrx
2. 주식 데이터 가져오기
timefrom='20230101'
timeto="20231027"
df_1_name='YG Entertainment'
df_1_code="122870"
df_1_country="KR"
df_1 = stock.get_market_ohlcv_by_date(timefrom, timeto, df_1_code)
다른 변수는 편의상 일부러 만들어 준 것이고, 종목코드(df_1_code)만 필요하다. 이것을 넣어서 df_1을 생성하면 다음과 같은 결과가 나온다.
3. 주식 데이터 정렬하기
주식의 등락률을 기준으로 정렬하였다. 내림차순으로 정렬하였으므로 상승이 가장 높았을 때를 기준으로 정렬이 되었다. (하락이 가장 큰 시기를 기준으로 하고 싶으면 오름차순으로 정렬하면 된다.)
# 등락률 절댓값 기준으로 정렬(가장 많이 상승한 순서대로)
df_1_desc=df_1
df_1_desc=df_1_desc.sort_values(by="등락률", ascending=False)
df_1_desc.head()
절대값 열을 만들면 다음과 같이 볼 수 있다.
df_1_sort["등락률절댓값"]=abs(df_1_sort["등락률"])
'컴퓨터언어 > Python' 카테고리의 다른 글
[Python] 주가 이동평균선 구하기 (0) | 2020.12.29 |
---|