반응형
반응형
파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문 - 웹 크롤링과 스크레이핑부터 머신러닝.딥러닝까지 체계적으로 배우기

파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문
국내도서
저자 : 쿠지라 히코우즈쿠에 / 윤인성역
출판 : 위키북스 2017.06.15
상세보기


머신러닝의 바탕이 되는 데이터를 수집하고, 수집된 데이터를 기반으로 머신러닝을 수행하는 방법을 설명한다. 인터넷에서 데이터를 어떻게 효율적으로 수집하는지 알아보고, 머신러닝을 원활하게 할 수 있게끔 데이터를 가공하는 방법을 살펴보며 더 나아가 가공된 데이터를 이용해 챗봇 제작, 규동 메뉴 이미지 판정, 얼굴 인식 등 머신러닝에 활용하는 과정까지 실질적인 파이썬 예제 코드로 소개하고 있다. 활용할 데이터만 가지고 있다면 자신이 원하는 것을 만들어낼 수 있다.

역자 동영상 강의


[목   차]

▣ 00장: 머신러닝을 위한 데이터 처리
0-1. 크롤링, 스크레이핑, 머신러닝
___인터넷의 빅데이터
___스크레이핑, 크롤링, 데이터 가공
___머신러닝에 사용할 수 있는 데이터의 구조

▣ 01장: 크롤링과 스크레이핑
1-1. 데이터 다운로드하기
___웹상의 정보를 추출하는 방법
___urllib.request를 이용한 다운로드
___웹에서 데이터 추출하기
___BeautifulSoup로 스크레이핑하기
1-2. BeautifulSoup로 스크레이핑하기
___네이버 금융에서 환율 정보 추출하기
___웹 브라우저로 HTML 구조 확인하기
1-3. CSS 선택자
___위키 문헌에 공개돼 있는 윤동주 작가의 작품 목록 가져오기 
___CSS 선택자 자세히 알아보기
___CSS 선택자로 추출 연습하기
___정규 표현식과 함께 조합하기
1-4. 링크에 있는 것을 한꺼번에 내려받기
___한꺼번에 다운받는 데 필요한 처리 내용
___상대 경로를 전개하는 방법
___재귀적으로 HTML 페이지를 처리하는 방법

▣ 02장: 고급 스크레이핑
2-1. 로그인이 필요한 사이트에서 다운받기
___HTTP 통신
___requests 사용해보기
2-2. 웹 브라우저를 이용한 스크레이핑
___웹 브라우저 원격 조작에 사용하는 Selenium
___웹 사이트를 이미지로 캡처해보기
___네이버에 로그인해서 구매한 물건 목록 가져오기
___Selenium으로 스크레이핑하는 방법
___자바스크립트 실행해보기
2-3. 웹 API로 데이터 추출하기
___웹 API
___웹 API를 제공하는 이유
___웹 API 사용해보기 - OpenWeatherMap의 날씨 정보 
___국내에서 사용할 수 있는 웹 API
2-4. cron을 이용한 정기적인 크롤링
___정기적인 크롤링
___매일 환율 정보 저장하기
___cron으로 매일 한 번 실행하기
___crontab 설정 방법

▣ 03장: 데이터 소스의 서식과 가공
3-1. 웹의 다양한 데이터 형식
___텍스트 데이터와 바이너리 데이터
___XML 분석
___JSON 분석
___YAML 분석
___CSV/TSV 분석
___엑셀 파일 분석
3-2. 데이터베이스
___데이터베이스
___데이터 저장에는 어떤 데이터베이스를 사용해야 할까?
___SQLite - 가볍게 파일 하나로 사용할 수 있는 데이터베이스
___MySQL 사용하기
___TinyDB 사용하기

▣ 04장: 머신러닝
4-1. 머신러닝이란?
___머신러닝 개요
___머신러닝의 종류
___머신러닝의 흐름
___머신러닝의 응용 분야
___초과 학습(초과 적합)
4-2. 머신러닝 첫걸음
___머신러닝 프레임워크 scikit-learn
___XOR 연산 학습해보기
___붓꽃의 품종 분류하기
4-3. 이미지 내부의 문자 인식
___손글씨 숫자 인식하기
___이미지 데이터 학습시키기
4-4. 외국어 문장 판별하기
___외국어 판정
___판정 방법
___샘플 데이터 수집
___언어 판별 프로그램
___웹 인터페이스 추가하기
4-5. 서포트 벡터 머신(SVM)
___SVM이란?
___SVM을 실제로 사용해보기
___SVM의 종류
4-6. 랜덤 포레스트
___랜덤 포레스트란?
___랜덤 포레스트 사용하기
4-7. 데이터를 검증하는 방법
___크로스 밸리데이션
___그리드 서치

▣ 05장: 딥러닝
5-1. 딥러닝 개요
___딥러닝
5-2. TensorFlow 설치하기
___TensorFlow
___설치 방법
___설치가 제대로 됐는지 확인하기
___TensorFlow로 간단한 계산해보기
5-3. Jupyter Notebook
___Jupyter Notebook 설치하고 실행하기
___새 노트 만들기
___데이터 시각화
___TensorFlow와 함께 사용하기
5-4. TensorFlow 기본
___TensorFlow 기본
___머신러닝 해보기
5-5. TensorBoard로 시각화하기
___TensorBoard의 사용법
5-6. TensorBoard로 딥러닝하기
___딥러닝의 구조
___딥러닝 해보기 - MNIST 손글씨 데이터
5-7. Keras로 다양한 딥러닝 해보기
___Keras
___Keras 설치
___Keras로 MNIST 테스트해보기
___Keras로 비만도 판정해보기
5-8. Pandas/NumPy 다루기
___Pandas/NumPy
___데이터 조작
___Pandas/Numpy 정리

▣ 06장: 텍스트 분석과 챗봇 만들기
6-1. 한국어 분석(형태소 분석)
___형태소 분석
___한국어 형태소 분석 라이브러리
___출현 빈도 분석
6-2. Word2Vec으로 문장을 벡터로 변환하기
___Word2Vec
___Gensim 설치
___Gensim의 Word2Vec으로 "토지"를 읽어보기
___위키피디아 한국어 버전을 사전으로 사용해보기
___위키피디아 데이터로 놀아보기
6-3. 베이즈 정리로 텍스트 분류하기
___텍스트 분류
___베이즈 정리
___나이브 베이즈 분류
___베이지안 필터 사용해보기
6-4. MLP로 텍스트 분류하기
___MLP로 텍스트 분류하기
6-5. 문장의 유사도를 N-gram으로 분석하기
___문장의 유사도 분석
___레벤슈타인 거리
___파이썬으로 레벤슈타인 거리를 계산하는 프로그램
___N-gram으로 유사도 구하기
6-6. 마르코프 체인과 LSTM으로 문장 생성하기
___마르코프 체인과 LSTM/RNN
___마르코프 체인이란?
___마르코프 체인 구현하기
___LSTM/RNN
6-7. 챗봇 만들기
___챗봇(회화 봇)
___챗봇의 구조

▣ 07장: 이미지와 딥러닝
7-1. 유사 이미지 검출하기
___간단한 형태 인식 - Average Hash
7-2. CNN으로 Caltech 101의 이미지 분류하기
___CNN으로 색상 있는 이미지 분류해보기
7-3. 규동 메뉴 이미지 판정하기
___규동을 판정할 수 있는 PC가 좋은 PC
___스크레이핑부터 시작하기
7-4. OpenCV로 얼굴 인식하기
___OpenCV
___얼굴을 인식하는 프로그램 만들어보기
___얼굴에 모자이크 걸기
7-5. 이미지 OCR - 연속된 문자 인식하기
___OpenCV로 텍스트 영역 확인하기
___문자 인식 데이터 만들기
___다양한 숫자 폰트 학습 시키기

▣ 부록: 개발 환경 구축
부록-1. Docker로 개발 환경 구축하기
___Docker란?
___Docker 설치
___윈도우 10 이하에서 Docker Toolbox 설치하기
___macOS에서 Docker for Mac 설치하기
부록-2. 파이썬 + Anaconda 환경 준비
___파이썬 + Anaconda 이미지 다운로드


...



반응형
반응형

[도서구매] 베르메르의 모자, 코끼리의 후퇴


베르메르의 모자
국내도서
저자 : 티머시 브룩(Timothy Brook) / 박인균역
출판 : 추수밭 2008.06.25
상세보기


코끼리의 후퇴
국내도서
저자 : 마크 엘빈(Mark Elvin) / 정철웅역
출판 : 사계절 2011.05.25
상세보기




...

반응형
반응형

구글은 어떻게 일하는가, 져주는 대화


구글은 어떻게 일하는가
국내도서
저자 : 에릭 슈미트(Eric Schmidt),조너선 로젠버그(Jonathan Rosenberg),앨런 이글(Alan Eagle) / 박병화역
출판 : 김영사 2014.10.17
상세보기


져주는 대화
국내도서
저자 : 박성재
출판 : 책이있는마을 2017.04.15
상세보기



...


반응형
반응형

[도서구매] 가끔은 격하게 외로워야 한다. 내 옆에 있는 사람, 오직 두 사람, 아니라고 말하는 게 뭐가 어때서

가끔은 격하게 외로워야 한다
국내도서
저자 : 김정운
출판 : 21세기북스(북이십일) 2015.12.21
상세보기

내 옆에 있는 사람
국내도서
저자 : 이병률
출판 : 달 2015.07.01
상세보기

오직 두 사람
국내도서
저자 : 김영하(Young Ha Kim)
출판 : 문학동네 2017.05.24
상세보기

아니라고 말하는 게 뭐가 어때서
국내도서
저자 : 사노요코 / 전경아역
출판 : 을유문화사 2017.04.20
상세보기



...

반응형
반응형

보노보노처럼 살다니 다행이야, 언어의 온도 


보노보노처럼 살다니 다행이야
국내도서
저자 : 김신회
출판 : 놀(다산북스) 2017.04.06
상세보기



언어의 온도
국내도서
저자 : 이기주
출판 : 말글터 2016.08.19
상세보기


...

반응형
반응형

[도서구매] 파운데이션 - 아이작 아시모프


파운데이션 완전판 세트
국내도서
저자 : 아이작 아시모프(Isaac Asimov) / 김옥수역
출판 : 황금가지 2013.10.04
상세보기


알라딘 : http://www.aladin.co.kr/shop/wproduct.aspx?ItemId=31844172



파운데이션 완전판 세트 - 전7권


로봇 3원칙으로 잘 알려진 미래학자이자 세계 3대 SF 작가로 꼽히는 아이작 아시모프의 대표작. '파운데이션 시리즈'는 아이작 아시모프가 1942년부터 집필하여 사망에 이른 1992년까지 약 50년간 집필한 필생의 역작이자 국가와 인류의 미래를 예측하는 새로운 학문인 '심리 역사학'을 최초로 선보인 작품이다. 


2008년 노벨경제학상을 수상한 폴 크루그먼은 '우리 사회가 어떻게 나아갈지를 예측하고 대비하여 더 나은 방향으로 이끄는 학문'인 '심리 역사학'을 전공하고 싶었으나 현실에 없는 학문이라 가장 유사한 학문인 '경제학'을 선택하게 되었다고 고백한 적이 있을 만큼 '로봇 3원칙'과 함께 아시모프를 대표하는 키워드이다. 


에드워드 기번의 <로마제국 쇠망사>에서 영감을 얻어 집필된 작품인 만큼, SF라는 외피를 걷어내면 현실 정치와 국가의 흥망성쇄를 다룬 역사적 이야기들이 소설적 재미와 함께 흥미로운 이야깃거리를 선사한다. 이 작품은 휴고상, 네뷸러상, 로커스상 등을 수상했으며, 2013년 현재 할리우드에서 대작 영화로 기획 중이어서 많은 팬들로부터 <반지의 제왕>에 비견될 트릴로지 영화로 기대를 모으고 있다. 


2012년에는 유력 대선 예비 후보였던 안철수 의원에 의해 '미래를 위한 노력의 중요성'을 강조하는 작품으로 인용되어 화제를 모으기도 했다. 무엇보다 이번 판본은 국내에 첫 소개되는 아시모프의 유작 <파운데이션을 향하여>를 포함한 완전판 시리즈이며, 과거 짜깁기와 분권, 뒤죽박죽이던 순서를 바로잡아 최초의 출간일순에 맞게 순서를 재정돈함은 물론, 두께에 상관없이 원서와 동일한 권수로 출간하였다.



파운데이션 완전판 1-7


1권 파운데이션


2권 파운데이션과 제국


3권 제2파운데이션


4권 파운데이션의 끝


5권 파운데이션과 지구


6권 파운데이션의 서막


7권 파운데이션을 향하여




저자 : 아이작 아시모프 (Isaac Asimov)  

  

수상 : 1997년 휴고상, 1996년 네뷸러상, 1992년 휴고상, 1983년 휴고상

         , 1973년 휴고상, 1972년 네뷸러상

 

최근작 : <생명과학의 역사>,<아자젤>,<파운데이션을 향하여> … 총 167종 (모두보기)


소개 :

1920년 1월 2일 러시아의 페트로비치(Petrovichi)에서 출생하였으며 3살 때 가족이 미국으로 이주하였다. 1948년 컬럼비아 대학에서 생화학 박사 학위를 취득하여 보스턴대학교에서 생화학 교수를 역임하였다. 그러나 그를 정작 유명인으로 만든 것은 SF 소설이었다. 21세의 나이에 훗날 SF 소설의 초석이 되는 파운데이션 시리즈(Foundation Series)를 시작하였다. 그는 로봇, 엠파이어, 파운데이션 시리즈 등 수상 경력이 있는 SF 소설로 많은 사랑을 받았고 과학에서부터 셰익스피어, 역사에 이르기까지 다양한 주제에 대해 470권이 넘는 책을 저술하였다. 미국 과학 소설 및 판타지 작가 협회로부터 SF 소설의 그랜드 마스터라는 별명을 얻게 되었다. 50년 가까이 모든 연령층의 독자들에게 즐거움과 교훈을 선사하다가 1992년 4월 72세의 나이로 사망하였다. 


대표작으로는 총 일곱 편으로 구성된 ‘파운데이션’ 시리즈를 비롯해『강철 도시』『벌거벗은 태양』등의 로봇 시리즈, 그리고 『우주의 기류』『별들은 먼지처럼』등의 은하제국 3부작과 네뷸러상과 휴고상을 모두 수상한『신들 자신』등이 있으며, 영화 <아이, 로봇>과 <바이센테니얼 맨>의 원작인「아이, 로봇」『200년을 산 사나이』가 있다. 아이작 아시모프는 휴고상, 네뷸러상 등을 수차례 수상했으며, 유수 대학으로부터 14개의 명예박사 학위를 받았다. 1971년에는 미국SF작가협회에서 ‘SF의 그랜드마스터’ 칭호를 받은 바 있다. 그리고 그의 이름을 딴 소행성, 과학 잡지, 초등학교가 있고, SF 및 교양과학 분야에 각각 그의 이름이 붙은 상이 있을 정도로 지금도 전 세계적으로 많은 명성을 유지하고 있다. 



.

반응형

+ Recent posts