[Python] pdf to text | Parsing 기본, 기초,시작 정규식(병기표현)
파이썬으로 pdf -> text 추출을 하기 위해 공부한 내용을 정리한다. 처음부터 정리했기 때문에 데이터 정제를 하는 사람이라면 꼭 참고하여 도움이 되길... 처음 인지해야 할 것! ☆ 처음 들어온 값이 리스트인지 스트링 타입인지 알 것 - 이걸 알고 있는 상태로 전체 로직을 구성해야한다. ☆ 들어오는 인풋 값과 나가는 아웃풋이 무엇으로 나가는지 생각해야 한다.(위와 같은 내용) - 아무것도 모를 때 신경을 쓰지 않았는데 그러다 보니 타입 오류 & 정규식이 먹지 않는 현상이 발생한다. ☆ 네이밍 신경 쓰기 - answer, result, sentence 이런 것만 돌리지 말고 한눈에 이해할 수 있는 변수명 사용하기 ☆ 작동이 되지 않는다면 print() 함수를 이용하여 하나하나 어떤 값이 들어오는지 찍..
💻 개발/언어
2021. 6. 23. 08:26
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday