콘텐츠 바로가기
본문 바로가기


YES24 카테고리 리스트

YES24 유틸메뉴

Global YES24안내보기

Global YES24는?

K-POP/K-Drama 관련상품(음반,도서,DVD)을
영문/중문 으로 이용하실 수 있습니다.

Korean wave shopping mall, sell the
K-POP/K-Drama (CD,DVD,Blu-ray,Book) We aceept PayPal/UnionPay/Alipay
and support English/Chinese Language service

English

作为出售正规 K-POP/K-Drama 相关(CD,图书,DVD) 韩流商品的网站, 支持 中文/英文 等海外结账方式

中文

검색


어깨배너

2월 전사이벤트
카카오뱅크 최대 8천원 캐시백
북클럽 BC카드 1천원 캐시백
모바일팝 모바일 5% 할인
카카오페이 4천원 즉시할인
1/6

빠른분야찾기


윙배너

마우스를 올려주세요.

마케팅 텍스트 배너

웹진채널예스


2월 상품권
대용량 머신 러닝과 스파크
미리보기 공유하기
소득공제

대용량 머신 러닝과 스파크

빅데이터 기반의 머신 러닝 애플리케이션 구축

레자울 카림, 마헤디 카이저 저/이지훈 | 에이콘출판사 | 2018년 07월 16일 | 원서 : Large Scale Machine Learning with Spark: Discover everything you need to build robust machine learning applications with Spark 2.0 첫번째 구매리뷰를 남겨주세요. | 판매지수 690 판매지수란?
상품 가격정보
정가 35,000원
판매가 31,500 (10% 할인)
YES포인트
추가혜택쿠폰 및 사은품(1종)
추가혜택쿠폰 쿠폰받기
  • 주문금액대별 할인쿠폰
결제혜택
결제혜택 카드/간편결제 혜택을 확인하세요 카드/간편결제 혜택 보기/감추기
카드할인 정보
카카오페이 카카오페이 4천원 즉시할인 (1회당 5만원 이상 결제시, 기간내 1회) 자세히 보기
카카오뱅크 카카오뱅크 4천/8천원 캐시백 (5/10만원 이상 결제시, 누적금액 기준) 자세히 보기
모바일팝 모바일팝 5% 즉시할인 (모바일 결제시) 자세히 보기
네이버페이 네이버페이 네이버페이 1% 적립 (전체결제) 자세히 보기
구매 시 참고사항
구매 시 참고사항

판매중

수량
배송비 : 무료 배송비 안내
  • 해외배송 가능
  • 최저가 보상
  • 문화비소득공제 신청가능
1/4
광고 AD

출판사 추천

광고 AD

품목정보

품목정보
출간일 2018년 07월 16일
쪽수, 무게, 크기 560쪽 | 1,031g | 188*235*28mm
ISBN13 9791161751771
ISBN10 1161751777

관련분류

책소개

  •  책의 일부 내용을 미리 읽어보실 수 있습니다. 미리보기

목차

저자 소개 (3명)

알고리즘 및 데이터 구조, C / C ++, 자바(Java), 스칼라(Scala), R 및 파이썬(Python)과 스파크(Spark), 카프카(Kafka), DC/OS, 도커(Docker), 메소스(Mesos), 하둡(Hadoop) 및 맵리듀스(MapReduce)와 같은 빅데이터 기술에 중점을 두면서 연구 개발 분야에서 8년 이상의 경력을 쌓았다. 머신 러닝, 심층 학습, 시맨틱 웹, 빅데이터 및 생물 정보학 분... 알고리즘 및 데이터 구조, C / C ++, 자바(Java), 스칼라(Scala), R 및 파이썬(Python)과 스파크(Spark), 카프카(Kafka), DC/OS, 도커(Docker), 메소스(Mesos), 하둡(Hadoop) 및 맵리듀스(MapReduce)와 같은 빅데이터 기술에 중점을 두면서 연구 개발 분야에서 8년 이상의 경력을 쌓았다. 머신 러닝, 심층 학습, 시맨틱 웹, 빅데이터 및 생물 정보학 분야 연구에 관심을 두고 있다. 『Large Scale Machine Learning with Spark』(Packt, 2016)의 저자다.
현재 아일랜드의 데이터 분석 센터에서 근무하는 소프트웨어 엔지니어이자 연구원이다. 또한 골웨이에 있는 아일랜드 국립대학교(National University of Ireland)의 박사 후보자며, 컴퓨터 공학 학사 및 석사 학위를 취득했다. 데이터 분석 센터에 입사하기 전에는 삼성전자에서 리드 소프트웨어 엔지니어로 일하면서 한국, 인도, 베트남, 터키, 방글라데시 등 전 세계에 분산돼 있는 삼성 R&D 센터에서 일했다. 또한 경희대학교 데이터베이스 연구소의 연구 조교로 근무했다. 그는 한국에 있는 BMTech21 Worldwide에서 R&D 엔지니어로 일했고 그 전에는 방글라데시 다카의 i2SoftTechnology에서 소프트웨어 엔지니어로 일했다.
아일랜드 더블린 시티 대학교(Dublin City University, Ireland)의 Insight Center for Data Analytics의 소프트웨어 엔지니어이자 연구원이다. Insight Center for Data Analytics에 합류하기 전에 골웨이의 아일랜드 국립 대학교와 방글라데시에 위치한 삼성전자에서 소프트웨어 엔지니어로 근무했다. C, 자바, 스칼라, 파이썬 중심의 알고리즘과 데이터... 아일랜드 더블린 시티 대학교(Dublin City University, Ireland)의 Insight Center for Data Analytics의 소프트웨어 엔지니어이자 연구원이다. Insight Center for Data Analytics에 합류하기 전에 골웨이의 아일랜드 국립 대학교와 방글라데시에 위치한 삼성전자에서 소프트웨어 엔지니어로 근무했다.
C, 자바, 스칼라, 파이썬 중심의 알고리즘과 데이터 구조에 대한 탄탄한 경험을 바탕으로 R&D에서 5년 이상 활동했다. 또한 전사적 애플리케이션(enterprise application) 개발과 빅데이터 분석 분야에서 많은 경험을 쌓았다.
방글라데시 치타공 공과 대학(Chittagong University of Engineering and Technology)에서 컴퓨터 과학 및 공학 학사 학위를 취득했다. 현재는 아일랜드 더블린 시티 대학교에서 분산 및 병렬 컴퓨팅(Distributed and Parallel computing)에 대한 대학원 연구를 시작했다.
기계공학을 전공했지만 자바 웹 개발을 시작으로 안드로이드/iOS 기반의 앱을 개발했으며, 최근 몇 년간은 하둡과 스파크 및 딥러닝에 관련된 소프트웨어를 개발해왔다. 또한 IT 관련 서적의 저자 및 번역가로도 활동한다. 『나홀로 개발자를 위한 안드로이드』(에이콘, 2013), 『Java 프로그래밍 입문』(북스홀릭퍼블리싱, 2013)을 저술했고, 『프로그래머를 위한 안드로이드』(정보문화사, 2015), 『Androi... 기계공학을 전공했지만 자바 웹 개발을 시작으로 안드로이드/iOS 기반의 앱을 개발했으며, 최근 몇 년간은 하둡과 스파크 및 딥러닝에 관련된 소프트웨어를 개발해왔다. 또한 IT 관련 서적의 저자 및 번역가로도 활동한다. 『나홀로 개발자를 위한 안드로이드』(에이콘, 2013), 『Java 프로그래밍 입문』(북스홀릭퍼블리싱, 2013)을 저술했고, 『프로그래머를 위한 안드로이드』(정보문화사, 2015), 『Android Internals Vol.1』(에이콘, 2016), 『스위프트로 하는 iOS 9 프로그래밍』(에이콘, 2016), 『대용량 머신 러닝과 스파크』(에이콘, 2018) 등 수십 권의 책을 번역했다.

만든 이 코멘트

저자, 역자, 편집자를 위한 공간입니다. 독자들에게 전하고 싶은 말씀을 남겨주세요. 코멘트 쓰기
접수된 글은 확인을 거쳐 이 곳에 게재됩니다.
독자 분들의 리뷰는 리뷰 쓰기를, 책에 대한 문의는 1:1 문의를 이용해 주세요.

출판사 리뷰

학계에 종사하거나 연구자, 데이터 과학 엔지니어 또는 대용량의 복잡한 데이터셋으로 작업하는 빅데이터 엔지니어라면 이 책이 도움이 될 것이다. 그리고 데이터 처리 파이프라인과 머신 러닝 애플리케이션을 더 빠르게 확장하려 한다면 역시 이 책이 적합한 동반자가 돼줄 것이다.
이 책의 내용을 충분히 배우려면 적어도 기본적인 머신 러닝 개념은 알고 있어야 한다. 아파치 스파크와 하둡 기반 맵리듀스 같은 오픈소스 툴과 프레임워크에 대해 알고 있으면 좋겠지만, 잘 모르더라도 문제없다. 통계학과 계산 수학에 대한 탄탄한 배경지식이 필요하며 스칼라, 파이썬, 자바에 관해서는 어느 정도 아는 것이 좋다. 하지만 어떤 경우라도 중간 프로그래밍 언어(intermediate programming language)에 익숙하다면 이 책에서 설명하는 논제와 예제들을 충분히 이해할 수 있을 것이다.

- 알고리즘의 명확한 이론적 이해
- 스칼라, 자바, 파이썬, R을 사용한 애플리케이션 개발을 위해 클러스터 및 클라우드 인프라에서 스파크 설정하기
- 대규모 클러스터 또는 클라우드 인프라에서 ML 애플리케이션 스케일 업
- 스파크 ML과 MLlib를 사용해 추천 시스템, 분류, 회귀, 클러스터링, 정서 분석, 차원 감소를 위한 ML 파이프라인 개발하기
- 피처 엔지니어링 중심으로 ML 애플리케이션을 개발하기 위한 대규모 텍스트 처리
- 스파크 스트리밍(Spark Streaming)을 사용해 실시간 스트리밍을 위한 ML 애플리케이션 개발하기
- 교차 유효성 검사, 초매개변수 튜닝, 트레인 분할을 사용한 ML 모델 튜닝
- 동적 모델과 증분 환경에 새로운 모델을 적용할 수 있도록 ML 모델 개선하기


1장. '스파크를 이용한 데이터 분석의 개요'에서는 스파크의 개요와 컴퓨팅 패러다임, 설치를 다루므로 스파크를 시작하는 데 도움을 준다. 스파크의 주요 컴포넌트를 간략히 설명하고, RDD(Resilient Distributed Dataset)와 데이터셋(Dataset)으로 인한 새로운 컴퓨팅의 발전에 초점을 맞춘다. 그러고 나서 스파크의 머신 러닝 라이브러리 생태계에 주목해본다. 아마존 EC2(Amazon EC2)를 확장하기 전에, 스파크와 메이븐(Maven)을 사용해 간단한 머신 러닝 애플리케이션을 설치하고 구성하고 패키지하는 방법을 보여준다.

2장. '머신 러닝 모범 사례'에서는 통계적 머신 러닝 테크닉의 개념을 소개한다. 이는 머신 러닝에 대해 최소한만 알고 있는 수준부터 어느 정도는 알고 있는 실무 영역의 수준까지 아우르므로 모든 입문자들에게 도움이 될 것이다. 2장의 후반부에서는 주로 애플리케이션 유형 및 요구 사항에 맞게 적합한 머신 러닝 알고리즘을 선택하기 위한 약간의 권장 사항을 제공한다. 그 다음 대규모 머신 러닝 파이프라인을 적용할 때 몇 가지 모범 사례들을 살펴본다.

3장. '데이터 이해를 통한 문제 이해'에서는 이용 가능한 데이터를 가지고 머신 러닝 문제에 대한 기본적인 내용을 이해하는 것을 목표로, 구조화된 데이터 작업을 위한 데이터셋과 RDD API를 상세히 다룬다. 이 장을 배우고 나면 기본적이고 복잡한 데이터 조작을 손쉽게 다룰 수 있게 된다. 프로그래밍과 성능 면에서 도움이 되도록, RDD와 데이터셋을 기반으로 데이터 조작을 사용하는 스파크의 기본 추상화와 비교해본다. 또한 메모리에 RDD 또는 데이터 객체를 유지하도록 스파크를 사용하고, 이것이 이후 단계의 병렬 작업에서도 효율적으로 재사용될 수 있도록 안내한다.

4장. '피처 엔지니어링을 통한 지식 추출'에서는 예측 모델을 생성하기 위해서는 사용해야 하는 기능을 아는 것이 중요하다. 뿐만 아니라, 이러한 기능을 아는 것은 검사할 문제 영역에 대한 고도의 지식이 필요할 만큼 어렵다. 누군가가 작업 중인 문제에 가장 유용하거나 가장 관련성이 있는 기능들을 데이터에서 자동으로 선택할 수도 있다. 이런 문제들을 고려해 4장에서는 피처 엔지니어링을 상세히 다루고 피처 엔지니어링 모범 사례와 함께 적용 이유를 설명한다. 이외에도 스파크 MLlib API와 스파크 ML API 모두를 사용해 대규모 머신 러닝 기술에 적용된 피처 추출, 변환, 선택에 대한 이론적 설명과 사례들이 논의될 것이다.

5장. '예제로 보는 지도 및 비지도 학습'에서는 이전 장들을 기반으로 널리 사용되는 사례들을 통해 이용 가능한 데이터에 대한 지도 및 비지도 기술들을 새로운 문제에 빠르고 강력하게 적용하는 방법에 대한 실질적인 지식을 제공한다. 이러한 사례들은 스파크 관점에서 소개된다.

6장. '확장 가능한 머신 러닝 파이프라인 빌드'에서는 머신 러닝의 궁극적인 목표가 지루하고 시간 소모적인 인간의 개입과 상호작용 없이 데이터로부터 모델을 자동으로 빌드할 수 있는 머신을 만드는 것이라고 설명한다. 따라서 여기서는 스파크 MLlib와 스파크 ML을 사용해 실용적이고 널리 사용되는 머신 러닝 파이프라인과 애플리케이션의 생성에 대해 살펴본다. 이 두 가지 API는 자세히 설명될 것이고, 이들 모두에 대한 기준 라인 사용 사례도 역시 다뤄질 것이다. 그러고 나서 데이터 로드 증가에 대처할 수 있도록 ML 애플리케이션을 확장하는 방향으로 초점을 맞춘다.
7장. '머신 러닝 모델 튜닝'에서는 알고리즘이나 머신 러닝 애플리케이션 튜닝이 알고리즘이 최상의 성능을 발휘할 수 있도록 모델에 영향을 주는 매개변수를 검토하고 최적화하는 과정임을 보여준다. 모델 튜닝을 안내하는 것을 목표로, 여기서는 ML 알고리즘의 성능을 최적화하기 위해 사용되는 주요 기술을 다루고, MLlib와 스파크 ML 관점 모두에서 기술을 설명한다. 또한 초매개변수, MLlib 및 스파크 ML을 사용한 그리드 검색 매개변수, 가설 테스트, 랜덤 검색 매개변수 튜닝, 교차 유효성 검사 등과 같은 여러 매개변수를 튜닝해 ML 모델 성능을 향상시키는 방법을 보여준다.

8장. '머신 러닝 모델 조정'에서는 알고리즘을 새로운 데이터와 문제 유형에 적용할 수 있도록 하는 고급 머신 러닝 기술을 다룬다. 주로 배치/스트리밍 아키텍처와 스파크 스트리밍을 사용한 온라인 러닝 알고리즘에 초점을 맞춘다. 궁극적인 목표는 정적인 머신 러닝에 역동성을 더하는 것이다. 아울러 머신 러닝 알고리즘이 데이터에서 점차적으로 학습하는 방법, 즉 알고리즘이 새로운 학습 인스턴스를 볼 때마다 모델이 업데이트되는 방법을 소개한다.

9장. '스트리밍 및 그래픽 데이터를 사용한 고급 머신 러닝'에서는 스파크 MLlib와 스파크 ML 심리 분석을 수행하는 방법을 보여준다. 또한 스파크 MLlib를 사용한 대규모 영화 추천 의 도움으로, 예를 들어 토픽 모델링에서 스트리밍과 그래프 데이터에 머신 러닝 기술을 적용하는 방법을 설명한다. 결국 사용 가능한 API를 통해 트위터 같은 데이터 소스를 스트리밍해서 실시간 애플리케이션, 예측적 애플리케이션을 빌드할 수 있게 될 것이다. 이어서 트위터 데이터 분석을 통해 대규모 사회 시스템을 개발하는 방법도 살펴볼 텐데, 이를 위해 소셜 네트워크 분석이 일반적으로 사용된다.

10장. '외부 라이브러리를 이용한 설정 및 작업'에서는 데이터 분석을 확장하기 위한 외부 라이브러리 사용을 안내한다. 스파크 코어와 ML/MLlib로 머신 러닝 애플리케이션을 위한 서드파티 패키지 또는 라이브러리를 배치하는 것에 대한 사례가 제공되며, 시계열을 위해 스파크의 코어 라이브러리를 사용해 외부 라이브러리를 컴파일하고 사용하는 방법에 대해서도 논의한다. 탐색 데이터를 조작하고 다루는 법을 향상시키기 위해 스파크R(SparkR)을 구성하는 법에 대해서도 역시 논의할 것이다.

회원리뷰 (0건)

매주 10건의 우수리뷰를 선정하여 YES상품권 3만원을 드립니다.
3,000원 이상 구매 후 리뷰 작성 시 일반회원 300원, 마니아회원 600원의 YES포인트를 드립니다.
(CD/LP, DVD/Blu-ray, 문구/GIFT, 패션 및 판매금지 상품, 예스24 앱스토어 상품 제외)
리뷰쓰기

등록된 리뷰가 없습니다.

첫번째 리뷰어가 되어주세요.

한줄평 (0건)

1,000원 이상 구매 후 한줄평 작성 시 일반회원 50원, 마니아회원 100원의 YES포인트를 드립니다.
(CD/LP, DVD/Blu-ray, 문구/GIFT, 패션 및 판매금지 상품, 예스24 앱스토어 상품 제외)
0/50

등록된 한줄평이 없습니다.

첫번째 한줄평을 남겨주세요.

배송/반품/교환 안내

배송 안내

배송 안내
배송 구분 YES24 배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4

반품/교환 안내

※ 상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내
반품/교환 방법
  • 마이페이지 > 반품/교환 신청 및 조회, 1:1 문의, 고객만족센터(1544-3800), 중고샵(1566-4295)
    * 판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  • 출고 완료 후 10일 이내의 주문 상품
  • 디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  • 중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  • 고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  • 직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음
  • 박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며,
  • 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  • 중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  • 상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상
  • 대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
예스이십사(주)
서울시 영등포구 은행로 11, 5층~6층(여의도동,일신빌딩) 대표 : 김석환   개인정보보호책임자 : 한광일 privacy@yes24.com 사업자등록번호 : 229-81-37000   통신판매업신고 : 제 2005-02682호 사업자 정보확인
고객만족센터 T.1544-3800
상담 전화번호
  • 중고샵 문의 1566-4295
  • 영화예매 문의 1544-7758
  • 공연예매 문의 1544-6399
1:1 친절상담 자주 묻는 질문 상담시간 안내
상품정보 문의 bookinfo@yes24.com
YES24 수상내역 정보보호 관리체계 ISMS인증획득 개인정보보호 우수사이트
소비자피해보상보험 서울보증보험
고객님은 안전거래를 위해 현금 등으로 결제 시 저희 쇼핑몰에서 가입한 구매안전서비스를 이용하실 수 있습니다. 서비스가입사실 확인
EQUUS9