콘텐츠 바로가기
본문 바로가기

YES24 카테고리 리스트

YES24 유틸메뉴

Global YES24안내보기

Global YES24는?

K-POP/K-Drama 관련상품(음반,도서,DVD)을
영문/중문 으로 이용하실 수 있습니다.

Korean wave shopping mall, sell the
K-POP/K-Drama (CD,DVD,Blu-ray,Book) We aceept PayPal/UnionPay/Alipay
and support English/Chinese Language service

English

作为出售正规 K-POP/K-Drama 相关(CD,图书,DVD) 韩流商品的网站, 支持 中文/英文 等海外结账方式

中文

검색


어깨배너

2월 혜택 모음
1/6

빠른분야찾기



자연어 처리와 컴퓨터 언어학
미리보기 공유하기
소득공제 에이콘 데이터 과학 시리즈

자연어 처리와 컴퓨터 언어학

파이썬으로 개발하는 자연어 처리 서비스

[ 2020년 대한민국학술원 우수학술도서 선정도서 ]
바르가브 스리니바사 디지칸 저/마창수 | 에이콘출판사 | 2019년 06월 28일 | 원서 : Natural Language Processing and Computational Linguistics: A practical guide to text analysis with Python, Gensim, spaCy, and Keras 첫번째 구매리뷰를 남겨주세요. | 판매지수 204 판매지수란?
상품 가격정보
정가 30,000원
판매가 27,000 (10% 할인)
YES포인트
배송안내
배송안내 바로가기

구매 시 참고사항
구매 시 참고사항

판매중

수량
  • 국내배송만 가능
  • 최저가 보상
  • 문화비소득공제 신청가능
1/4
광고 AD

자연어 처리와 컴퓨터 언어학

품목정보

품목정보
출간일 2019년 06월 28일
쪽수, 무게, 크기 392쪽 | 188*235*23mm
ISBN13 9791161753140
ISBN10 1161753141

관련분류

이 상품의 태그

  •  검색 페이지에서 선택된 태그에 등록된 더 많은 상품을 확인해 보세요. 전체보기

이 상품의 이벤트 (9개)

책소개

  •  책의 일부 내용을 미리 읽어보실 수 있습니다. 미리보기

목차

저자 소개 (2명)

프랑스 릴에 있는 INRIA에서 연구원으로 근무하고 있다. MODAL(데이터 분석 및 학습 모델) 팀의 일원이며 함수 학습(metric learning), 예측 변수 집계(predictor aggregation) 및 데이터 시각화를 담당하고 있다. 파이썬 오픈 소스 커뮤니티에 정기적으로 기고하고 있으며 ‘Google Summer of Code in 2016’에서 젠심(Gensim)을 이용한 동적 토픽 모델을 구현... 프랑스 릴에 있는 INRIA에서 연구원으로 근무하고 있다. MODAL(데이터 분석 및 학습 모델) 팀의 일원이며 함수 학습(metric learning), 예측 변수 집계(predictor aggregation) 및 데이터 시각화를 담당하고 있다. 파이썬 오픈 소스 커뮤니티에 정기적으로 기고하고 있으며 ‘Google Summer of Code in 2016’에서 젠심(Gensim)을 이용한 동적 토픽 모델을 구현하기도 했다.
유럽과 아시아에서 열리는 파이콘과 파이데이터 행사에 고정 연사로 참석하면서 파이썬을 이용한 텍스트 분석 튜토리얼을 작성하고 있다. 파이썬 머신 러닝 패키지인 pycobra의 관리자이며 「Journal of Machine Learning Research」(MIT, 2002)를 출간했다.
학부에서 정보통신공학을 전공하고 대학원에서는 인공지능을 전공햇다. IMF로 어렵던 시절 IT 업계에 입문해 현재까지 약 18여 년에 이르고 있다. 경력 초기에는 주로 C/C++ 등을 이용한 다양한 윈도우 애플리케이션과 알고리즘 개발에 전념하다가 IT엔지니어에게 프로그램 개발 능력뿐 아니라 기술 산업에 대한 전문성도 중요하다는 점을 깨닫고 당시 스마트폰 확산으로 붐 업이 된 위치 기반 서비스(Location Ba... 학부에서 정보통신공학을 전공하고 대학원에서는 인공지능을 전공햇다. IMF로 어렵던 시절 IT 업계에 입문해 현재까지 약 18여 년에 이르고 있다.
경력 초기에는 주로 C/C++ 등을 이용한 다양한 윈도우 애플리케이션과 알고리즘 개발에 전념하다가 IT엔지니어에게 프로그램 개발 능력뿐 아니라 기술 산업에 대한 전문성도 중요하다는 점을 깨닫고 당시 스마트폰 확산으로 붐 업이 된 위치 기반 서비스(Location Base Service, LBS)에 참여해 세계 각국 디지털 지도 데이터를 다루는 일에도 종사했다. 이후 기술 트렌드 및 산업 영역에 대한 역량을 확대하기 위해 ITS(Intelligence Transport System), 그린(Green) IT의 에너지관리시스템(Energy Management system, EMS), 빅데이터, 클라우드, IoT를 활용한 원격검침시스템(Automatic Meter Reading, AMR) 등 다양한 산업 분야에 대한 프로젝트와 IT 기술 기획에 참여했다.
현재는 SK에서 여러 산업 분야에 인공지능을 전파하기 위해 Aibril을 통한 인공지능 기술 도입을 지원하고 있으며 IBM 왓슨의 한국어 서비스를 도입하고 확장하는 업무를 담당하고 있다. 저서로는 『과학 영재를 만드는 아두이노 교실 2/e』(에이콘출판, 2018), 번역서로 『왓슨을 이용한 인공지능 서비스 입문』(책만, 2017), 『자연어 처리와 컴퓨터 언어학』(에이콘출판, 2019) 등이 있다.

만든 이 코멘트

저자, 역자, 편집자를 위한 공간입니다. 독자들에게 전하고 싶은 말씀을 남겨주세요. 코멘트 쓰기
접수된 글은 확인을 거쳐 이 곳에 게재됩니다.
독자 분들의 리뷰는 리뷰 쓰기를, 책에 대한 문의는 1:1 문의를 이용해 주세요.

출판사 리뷰

이 책의 구성은 다음과 같다.

1장, ‘텍스트 분석의 이해’
텍스트 분석 분야에서 지금과 같은 시기는 없었다. 쉽게 이용할 수 있는 데이터, 분석과 연구를 위해 사용할 수 있는 머신 러닝, 컴퓨터 언어학 이론과 텍스트 컴퓨터 처리를 수행할 수 있는 강력한 오픈 소스 도구들이 산재해 있고 이전에 보지 못한 속도로 발전하고 있다. 1장에서는 텍스트 분석이 정확히 무엇인지, 텍스트 분석을 배우는 동기와 이유가 무엇인지에 대해 자세히 알아본다.

2장, ‘텍스트 분석을 위한 파이썬 팁’
1장, ‘텍스트 분석의 이해’에서 텍스트 분석을 수행하기 위해 강력하고 사용하기 쉬운 언어인 파이썬을 사용해볼 것이라고 했다. 2장에서는 이를 확인하면서 텍스트 분석을 위해 알아둬야 할 기본적인 파이썬 활용법에 대해 다룬다. 이것이 중요한 이유는 무엇일까? 독자 여러분이 파이썬에 대한 기본적인 지식과 고등학교 수준의 수학적 배경이 있다고 가정하지만 텍스트 분석을 위해 파이썬 코드를 작성하고 문자열을 다루는 것은 웹 프레임워크인 장고(Django)를 사용해 웹 사이트를 구축하는 것과는 아주 다르다.

3장, ‘스파이시 언어 모델’
2장, ‘텍스트 분석을 위한 파이썬 팁’에서 텍스트 분석에 대해 소개할 때 텍스트 분석 파이프라인을 위해 필요한 상세한 기술적 내용은 다루지 않았다. 3장에서는 스파이시 언어 모델을 소개한다. 이 모델은 텍스트 분석의 첫 번째 단계에서 사용되며 파이프라인의 첫 번째 구성 요소가 된다. 또한 스파이시를 통해 텍스트 분석 작업을 수행하는 방법과 품사 태깅이나 NER과 같은 강력한 기능에 대해서도 알아본다. 마지막으로 스파이시를 효율적으로 사용하고 데이터를 빠르게 전처리하는 예제를 다룬다.

4장, ‘젠심-텍스트 벡터화, 변환 및 N-그램’
지금까지는 원시 텍스트 데이터를 다뤘지만 머신 러닝이나 정보 검색(IR, Information Retrieval) 알고리즘은 이와 같은 데이터를 사용하지 않는다. 따라서 알고리즘이 텍스트 데이터를 다룰 수 있도록 벡터라 불리는 수학적 구조를 이용해 변환해야 한다. 이런 변환을 수행하는 도구인 젠심과 추가 분석 단계의 앞 단계에 연결할 사이킷런을 소개한다. 전처리의 큰 부분은 유용하지 않다고 생각되는 단어들을 빈도수를 참조해 제거하는 것이고 이를 통해 바이그램, 트라이그램, N-그램과 같은 벡터화 작업을 시작할 수 있다.

5장, ‘품사 태깅 및 응용’
1장, ‘텍스트 분석의 이해’와 2장, ‘텍스트 분석을 위한 파이썬 팁’은 텍스트 분석과 파이썬에 대한 소개이고 3장, ‘스파이시 언어 모델’과 4장, ‘젠심-텍스트 벡터화, 변환 및 N-그램’은 좀 더 향상된 텍스트 분석을 구성할 수 있게 도와준다. 5장에서는 이런 향상된 기술의 첫 번째인 품사 태깅에 대해 설명한다. 품사 태깅이 무엇인지, 문서에서 어떻게 품사를 찾는지 그리고 품사 태깅이 어떻게 사용되는지 알아본다.

6장, ‘개체명 인식 및 응용’
5장, ‘품사 태깅 및 응용’에서 스파이시 언어 파이프라인을 이용해 매우 강력한 도구인 품사 태깅을 수행하는 방법을 알아봤다. 이제 또 다른 주제인 개체명 인식(NER, Named-Entity-Recognition)에 대해 알아본다. 언어학 및 텍스트 분석 관점에서 NER이 정확히 어떤 뜻을 갖는지 논의하고 실제 사용 예제를 다뤄본 후 스파이시를 이용해 자신의 개체명 인식기(Stanford Named Entity Recognizer)를 학습하는 법에 대해서도 배운다.

7장, ‘의존 구문 분석’
5장, ‘품사 태깅 및 응용’과 6장, ‘개체명 인식 및 응용’에서 스파이시 파이프라인이 어떻게 복잡한 컴퓨터 언어 알고리즘인 품사 태깅과 NER을 수행하는지 살펴봤다. 하지만 이것이 스파이시 기능의 전부가 아니다. 7장에서 의존 구문 분석(dependency parsing)의 강력함과 얼마나 다양한 상황과 응용에서 활용될 수 있는지 살펴본다. 스파이시를 사용하기 전에 의존 구문 분석의 이론을 살펴보고 자신만의 의존 구문 분석기를 학습한다.

8장, ‘토픽 모델링’
지금까지 컴퓨터 언어학 알고리즘과 스파이시를 다뤘고 컴퓨터 언어 알고리즘을 통해 데이터에 주석을 다는 방법과 문장의 구조를 이해하는 방법을 배웠다. 이 알고리즘이 텍스트의 좀 더 상세한 정보를 찾는 방법을 이해하는 데 도움이 됐지만 데이터의 큰 그림을 이해하는 데는 아직 미치지 못했다. 말뭉치에서 어떤 단어가 다른 단어보다 자주 나타나는가? 데이터를 그룹화하거나 숨은 테마를 찾을 수 있는가? 8장에서 이런 질문에 대한 답변과 그와 연관된 상세한 내용을 파헤쳐본다.

9장, ‘고급 토픽 모델링’
8장에서 토픽 모델의 강력함과 데이터에 대해 이해하고 탐색하는 데 얼마나 직관적인 도움이 되는지 알아봤다. 9장에서는 토픽 모델의 효용성과 말뭉치에서 제공하는 주제를 캡슐화하는 데 유용하게 쓰이는 토픽 모델을 생성하는 방법을 알아본다. 토픽 모델은 말뭉치에 포함된 문서를 이해하는 방법이므로 이전에 하지 않았던 방식으로 문서를 해석할 수 있다는 의미를 갖는다.

10장, ‘텍스트 군집화 및 분류’
9장, ‘고급 토픽 모델링’에서 토픽 모델링과 문서와 하위 구조를 조직화하고 이해하는 데 도움이 되는 방법들에 대해 알아봤다. 이제 머신 러닝을 이용한 두 가지 특별한 작업인 군집화와 분류에 대해 알아본다. 이 두 작업의 직관적 이론이 무엇인지 그리고 유명한 파이썬 머신 러닝 라이브러리인 사이킷런을 이용해 어떻게 수행할 수 있는지 알아본다.

11장, ‘유사 질의 및 요약’
일단 문서를 벡터 형태로 표현하기 시작하면 문서 간의 유사도나 거리를 찾을 수 있는데 이것이 바로 11장에서 배울 내용이다. 이제 표준 bog-of-word 또는 텍스트 문서의 토픽 모델 표현을 위한 TF-IDF와 같은 여러 가지 다른 벡터 표현법에 대해 알게 될 것이다. 또한 젠심에서 매우 유용한 특징 구현 방법에 대해 배우고 문서 요약과 키워드 추출 작업에서 이를 사용해볼 것이다.

12장, ‘Word2Vec, Doc2Vec과 젠심’
이 책의 앞 부분에서 벡터에 대해 많은 얘기를 나눴다. 벡터는 수학적 형태로 텍스트 데이터를 이해하고 표현하는 데 사용하며 이 표현은 모든 머신 러닝 방법에서도 기반이 된다. 한 단계 더 나아가 단어의 의미를 더 잘 내포하고 있는 벡터 표현을 생성하기 위해 머신 러닝 기술을 사용한다. 이 기술을 일반적으로 워드 임베딩이라고 하는데 Word2Vec(워드투백)과 Doc2Vec(독투백)이 가장 유명한 방법이다.

13장, ‘텍스트를 위한 딥러닝’
지금까지 토픽 모델링, 군집화, 분류, 텍스트 요약 등 여러 가지 의미에서 텍스트 데이터를 다루기 위한 머신 러닝의 활용에 대해 살펴봤다. 또한 품사 태깅과 개체명 인식기를 머신 러닝을 통해 직접 수행해봤다. 13장에서는 머신 러닝의 최첨단 기술 중 하나인 딥러닝에 대해 알아본다. 딥러닝은 생물학적 구조에서 영감을 얻어 만들어진 알고리즘으로, 텍스트를 이용한 작업을 수행하도록 도와주는 알고리즘이자 구조를 갖는 머신 러닝의 한 형태다. 이 작업 중 일부는 텍스트 생성, 분류 및 워드 임베딩이다. 13장에서는 딥러닝의 기초적인 내용과 텍스트를 위해 자신만의 딥러닝 모델을 구현하는 방법에 대해 알아본다.

14장, ‘케라스와 스파이시를 이용한 딥러닝’
13장에서 텍스트 데이터를 위한 딥러닝 기법에 대해 소개했고 신경망을 맛보기 위해 순환 인공 신경망(RNN, Recurrent Neural Networks)을 이용해 텍스트 생성을 시도해봤다. 14장에서는 텍스트를 위한 딥러닝 기술과 분류를 위해 케라스 모델을 설정하고 딥러닝을 위해 스파이시 파이프라인과 통합하는 방법을 알아본다.

15장, ‘감정 분석과 챗봇’
지금까지 텍스트 분석 과제를 시작할 수 있는 다양한 요소 기술을 갖췄으므로 이제 좀 더 복잡하고 무게감 있는 프로젝트에 대해 고려해볼 필요가 있다. 책 전반에 걸쳐 탐구해온 많은 개념들을 요약한 일반적인 2개의 텍스트 분석 프로젝트는 감정 분석과 챗봇이다. 이미 이 프로젝트를 위한 방법들을 대부분 다뤄봤고 15장에서는 어떻게 스스로 이러한 애플리케이션을 구성할 수 있는지에 대한 가이드를 제공한다. 챗봇이나 감정 분석 파이프라인을 구성하기 위해 필요한 코드를 모두 제공하지는 않지만 독자들이 이러한 프로젝트를 구성할 때 도움이 되는 다양한 기법에 대해 소개한다.

회원리뷰 (0건)

매주 10건의 우수리뷰를 선정하여 YES포인트 3만원을 드립니다.
3,000원 이상 구매 후 리뷰 작성 시 일반회원 300원, 마니아회원 600원의 YES포인트를 드립니다.
(CD/LP, DVD/Blu-ray, 패션 및 판매금지 상품, 예스24 앱스토어 상품 제외) 리뷰/한줄평 정책 자세히 보기
리뷰쓰기

등록된 리뷰가 없습니다.

첫번째 리뷰어가 되어주세요.

한줄평 (0건)

1,000원 이상 구매 후 한줄평 작성 시 일반회원 50원, 마니아회원 100원의 YES포인트를 드립니다.
(CD/LP, DVD/Blu-ray, 패션 및 판매금지 상품, 예스24 앱스토어 상품 제외) 리뷰/한줄평 정책 자세히 보기
0/50

등록된 한줄평이 없습니다.

첫번째 한줄평을 남겨주세요.

배송/반품/교환 안내

배송 안내

배송 안내
배송 구분 YES24 배송
  •  배송비 : 무료배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4

반품/교환 안내

※ 상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내
반품/교환 방법
  •  마이페이지 > 반품/교환 신청 및 조회, 1:1 문의, 고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
맨위로
예스이십사(주)
서울시 영등포구 은행로 11, 5층~6층(여의도동,일신빌딩) 대표 : 김석환   개인정보보호책임자 : 권민석 yes24help@yes24.com 사업자등록번호 : 229-81-37000   통신판매업신고 : 제 2005-02682호 사업자 정보확인 호스팅 서비스사업자 : 예스이십사(주)
YES24 수상내역 정보보호 관리체계 ISMS인증획득 개인정보보호 우수사이트
소비자피해보상보험 서울보증보험
고객님은 안전거래를 위해 현금 등으로 결제 시 저희 쇼핑몰에서 가입한 구매안전서비스를 이용하실 수 있습니다. 서비스가입사실 확인
ATOM