본문 바로가기

파이썬 공부(ft. sparta)/1주차

1-4. 업무자동화 - 파일다운로드, 이름 바꾸기

앞서 액셀 다루기 이후 계속해서 진행하는 것이다.

우선 코드스니펫에 있던 회사 리스트를 다운받아 아래 처럼 복붙한뒤 실행해준다.

keywords = ['삼성전자','LG에너지솔루션','SK하이닉스','NAVER','삼성바이오로직스','삼성전자우','카카오','삼성SDI','현대차','LG화학','기아','POSCO홀딩스','KB금융','카카오뱅크','셀트리온','신한지주','삼성물산','현대모비스','SK이노베이션','LG전자','카카오페이','SK','한국전력','크래프톤','하나금융지주','LG생활건강','HMM','삼성생명','하이브','두산중공업','SK텔레콤','삼성전기','SK바이오사이언스','LG','S-Oil','고려아연','KT&G','우리금융지주','대한항공','삼성에스디에스','현대중공업','엔씨소프트','삼성화재','아모레퍼시픽','KT','포스코케미칼','넷마블','SK아이이테크놀로지','LG이노텍','기업은행']

for keyword in keywords:
  print(keyword)
  get_news(keyword)
 
그러면 news폴더에 키워드에 해당하는 뉴스들이 다 올라가게 된다.
 
그리고 이 폴더를 압축해서 저장을 할거다.
 
우선 코드스니펫에 있는 '압축하기'를 복사한뒤 새로만든 코드창에 복붙한다.
 
!zip -r /content/files.zip /content/news
 
이걸 실행하게 되면 content안에있는 news를 묶어서 files.zip으로 보여줘라 라고 되서 옆에 
새로고침을 하게되면 files.zip 파일이 생긴다.
 
그러고 이 zip파일을 클릭해서 다운받아주면 된다.
 
 
이름 바꾸기

코드스니펫에 있는 파일명 체크를 복사한후 코드에 붙여넣는다.

import os

path = '/content/news'
files = os.listdir(path)

for file in files:
  print(file)

실행 후 제일 위에 나오는 파일명을 복사한뒤 새로운 코드를 열어서 아래처럼 적어준다.

name = '2023-03-30_기업은행.xlsx'

name.split('.')[0]+'(뉴스).xlsx'

이렇게 되면 우선 name.split('.')[0] 이부분은 . 을 기준으로 xlsx 앞에 있는 것들을 보여준다.

 

name.split('.')[0]+'(뉴스).xlsx' 이 코드를 치게 되면 결과는 아래와 같이 나온다.

2023-03-30_기업은행(뉴스).xlsx

 

그리고 한번에 많은 파일명을 같은 방식으로 고치려면 아래와 같이 하면 된다.

import os

path = '/content/news'
files = os.listdir(path)

for name in files:
  new_name = name.split('.')[0]+'(뉴스).xlsx'
  os.rename(f'/content/news/{name}',f'/content/news/{new_name}')
 
 
new_name = name.split('.')[0]+'(뉴스).xlsx' 이건 원래 이름을 뒤에 (뉴스)라는 것을 붙여넣고싶다.
 

os.rename(f'/content/news/{name}',f'/content/news/{new_name}') 이것은 이름명을 바꾸고 싶다.

os.rename(f'원래 저장된곳의 이름',f'저장된 곳의 변경할 이름') 이라고 생각하면 된다.

 

위 코드를 실행하게 되면 아까 저장 됬던 모든 news들의 제목 뒤에 (뉴스)가 붙은채로 저장된다.

'파이썬 공부(ft. sparta) > 1주차' 카테고리의 다른 글

1주차 끝 숙제  (0) 2023.03.31
1-5. 업무자동화 - 이미지 다운로드  (0) 2023.03.31
1-3. 엑셀다루기(1)  (0) 2023.03.29
1-2. 스크래핑실습(1)  (0) 2023.03.29
1-1. python 기초  (0) 2023.03.28