본문 바로가기
Projects/TJSSM

[단기] 04. Feature IMAGE 추출

by 생각하는달팽이 2015. 2. 6.

안녕하세요?

이번시간에는 저번시간에 하기로 했던.. URL 로부터 feature 이미지를 가져오는 기능을 구현하도록 하겠습니다.

아래는 대전 멤버쉽 남두현님의 정규식관련 자료입니다. 

이번 기능 구현에 많은 도움을 주셨습니다.



자 그럼 이제 시작하도록 하겠습니다.


순서


1. HTML 데이터를 받아옵니다.

2. <body> 데이터만 가져옵니다.

3. <script> 데이터 삭제합니다.

4. <img> 태그만 가져옵니다.

5. 가져온 태그를 이용하여 메인 이미지를 추출한다.

> 추출하는 것에 대해 이미지 크기가 큰걸로 추출하려고 합니다.


이미지 추출의 경우.

위와 같은 순서로 진행을 하려고 했지만 , 제 능력이 되지 않아. 메타태그의 이미지를 가져오는 것으로 돌아갔습니다.

시간내에 맞춰야하는 부분도 있고, 알고리즘 공부도 아에 안할 수가 없는게 핑계라면 핑계입니다.


없는 기사들에 대해서는 저희 로고를 가운데 박아서 띄워주는 것으로 처리하였습니다.



다음과 같은 결과물을 얻을 수 있었습니다.


시간이된다면, 정규식을 통해 정리해놓은 img 태그에서 feature 이미지를 추출하는 부분을 진행해볼 예정입니다.


반응형

'Projects > TJSSM' 카테고리의 다른 글

[단기] 05. 테스트 및 버그 수정  (0) 2015.02.11
[단기] 05. 서버 이관 작업  (0) 2015.02.11
[단기] 03. Chrome Extension 과 Facebook API  (0) 2015.02.05
[단기] 02. 환경구축  (0) 2015.02.01
[단기] 01.시작  (0) 2015.01.24