티스토리 뷰
반응형
import urllib
import time
from urllib import parse
from urllib.request import Request, urlopen
from bs4 import BeautifulSoup
naver_url = 'https://dict.naver.com/name-to-roman/translation/?query='
in_file = open("d:\\rep_nm_kor.txt", "r")
out_file = open("d:\\rep_nm_eng.txt", "a")
def ko_to_eng(name):
name_url = naver_url + urllib.parse.quote(name)
req = Request(name_url)
res = urlopen(req)
html = res.read().decode('utf-8')
bs = BeautifulSoup(html, 'html.parser')
name_tags = bs.select('#container > div > table > tbody > tr > td > a')
names = [name_tag.text for name_tag in name_tags]
if len(names) == 0:
return ""
return names[0]
if __name__ == '__main__':
i = 100
for line in in_file:
line = line.rstrip("\n")
out_file.write(line + "," + ko_to_eng(line) + "\n")
i = i - 1
if i == 0:
time.sleep(2)
i = 100
print(line)
in_file.close()
out_file.close()
<< 변환대상 >>
d:\\rep_nm_kor.txt
-----------------------------------
홍길동
이순신
<< 변환결과 >>
d:\\rep_nm_eng.txt
-----------------------------------
홍길동 Hong Gildong
이순신 Lee Soonsin
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 르세라핌
- VARIDESK
- JMW 헤어드라이기기
- Pixel Pals
- 별잉 빛나는 밤
- 별이 빚나는 밤
- 카카오 에드
- GKRS
- 유가바이트디비
- 솔리드 쿨론
- 배당급
- 증권정보포털
- 남설 팔찌
- Sybase IQ
- node.js
- 홈 오피스
- Life Chair
- 루미큐브 종류
- 매직 트랙패드2
- 톡토기
- weka
- 빈센트 반 고흐
- 코라나 19
- 오미크론
- 화분벌레
- 고체 향수
- 브리다 정수기
- 파나소닉 비데 DL-EH10KWS
- 로니카 BCS
- yugabyteDB
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함