콘텐츠 바로가기
본문 바로가기

YES24 카테고리 리스트

YES24 유틸메뉴

Global YES24안내보기

Global YES24는?

K-POP/K-Drama 관련상품(음반,도서,DVD)을
영문/중문 으로 이용하실 수 있습니다.

Korean wave shopping mall, sell the
K-POP/K-Drama (CD,DVD,Blu-ray,Book) We aceept PayPal/UnionPay/Alipay
and support English/Chinese Language service

English

作为出售正规 K-POP/K-Drama 相关(CD,图书,DVD) 韩流商品的网站, 支持 中文/英文 等海外结账方式

中文

검색


어깨배너

10월 전사 이벤트
2월 혜택 모음
이책아나
1/6

빠른분야찾기


윙배너

마우스를 올려주세요.
마우스를 올려주세요.

김나진 아나운서가 추천하는 인생 도서

관련상품
네가 웃으니 세상도 웃고 지구도 웃겠다

1971년에 등단한 나태주 시인은 새로운 반세기를 향하여 다시 출발한다.

네가 웃으니 세상도 웃고 지구도 웃겠다

나태주 저 | 시공사

마케팅 텍스트 배너


나쁜 데이터 핸드북
미리보기 공유하기
소득공제
19인의 데이터 과학자가 알려주는

나쁜 데이터 핸드북

이든 맥컬럼 저 / 문현선 | 비제이퍼블릭(BJ퍼블릭) | 2013년 06월 17일 | 원제 : Bad Data Handbook 리뷰 총점7.3 정보 더 보기/감추기
내용
3.8점
편집/디자인
3.5점
회원리뷰(6건)
상품 가격정보
정가 24,000원
판매가 21,600 (10% 할인)
YES포인트
구매 시 참고사항
구매 시 참고사항
  • 현재 새 상품은 구매 할 수 없습니다. 아래 상품으로 구매하거나 판매 해보세요.

품절| 한정판매

수량
  • 해외배송 가능
  • 최저가 보상
  • 문화비소득공제 신청가능
1/4
광고 AD

나쁜 데이터 핸드북

품목정보

품목정보
출간일 2013년 06월 17일
쪽수, 무게, 크기 324쪽 | 571g | 175*230*30mm
ISBN13 9788994774428
ISBN10 8994774424

관련분류

책소개

  •  책의 일부 내용을 미리 읽어보실 수 있습니다. 미리보기

목차

저자 소개

저자 : 이든 맥컬럼
전문 서비스 컨설턴트로서 데이터 분석에서부터 소프트웨어, 인프라 전반에 걸쳐 관심이 많다. 현실적인 기술을 활용해 기업이 위험을 줄이고, 이익을 높이고, 좀더 현명한 결정을 하게 함으로써 입지를 높일 수 있도록 돕는 일을 하고 있다. Parallel R: Data Analysis in the Distributed World(오라일리 2011)를 포함하여 그의 책은 온라인이나 서점에서 찾아볼 수 있다.
역자 : 문현선
고려대학교 컴퓨터학과를 졸업해 전자 회사에서 휴대폰, TV를 개발하다 2011년부터 KT 클라우드 추진본부에서 차세대 클라우드 서비스를 개발하고 있다. 오픈소스에 관심이 많으며 프레젠테이션 자료나 기술 문서를 만드는 데 남다른 애착을 가지고 있다. 앞으로도 기회가 되는대로 훌륭한 기술 서적들을 번역할 계획이다.

만든 이 코멘트

저자, 역자, 편집자를 위한 공간입니다. 독자들에게 전하고 싶은 말씀을 남겨주세요. 코멘트 쓰기
접수된 글은 확인을 거쳐 이 곳에 게재됩니다.
독자 분들의 리뷰는 리뷰 쓰기를, 책에 대한 문의는 1:1 문의를 이용해 주세요.

출판사 리뷰

19인의 데이터 과학자가 알려주는
나쁜 데이터 핸드북


나쁜 데이터란 무엇일까? 어떤 사람들은 나쁜 데이터가 누락된 값이나 어그러진 기록과 같은 기술적인 현상만을 포함한다고 생각하지만, 나쁜 데이터는 그보다 훨씬 더 많다. 데이터 전문가 이든 맥컬럼(Q. Ethan McCallum)은 지저분한 데이터 문제들을 극복하는 방법을 보이기 위해 다양한 영역의 데이터 과학자 19명을 한 자리에 모았다.

고장난 저장소에서부터 형편없는 표현, 그릇된 정책까지 나쁜 데이터가 되는 방법은 다양하다. 기본적으로, 나쁜 데이터란 여러분이 일하는 데 방해가 되는 모든 데이터이다. 이 책은 나쁜 데이터 문제를 해결하는 효과적인 방법을 설명한다.

이 책에서 다루는 내용:

- 데이터가 분석될 준비가 되었는지 테스트하는 방법
- 스프레드시트 데이터를 유용한 포맷으로 바꾸는 방법
- 텍스트 데이터에 숨어있는 인코딩 문제 다루는 방법
- 성공적인 웹 데이터 수집 방법
- NLP 툴을 사용해 온라인 리뷰의 진짜 의도를 밝히는 방법
- 분석 작업에 영향을 줄 수 있는 클라우드 컴퓨팅 이슈 다루는 방법
- 데이터 분석에 방해가 되는 방침을 피하는 방법
- 체계적인 데이터 퀄리티 분석 방법

독자대상

초중급

지저분한 작업, 수작업을 위한 지침

여러분은 새로 얻은 데이터셋(dataset)이 당장 분석할 수 있을 만큼 잘 정돈되어 있다고 생각하지 않을 것이다. 케빈 핑크(Kevin Fink)는 ‘2장 이 데이터 이상하지 않아요?’에서 데이터를 시험해볼 수 있는 몇 가지 방법을 제공한다.

수많은 데이터가 분석하기 어려운 형태의 스프레드시트에 갇혀 있다. ‘3장 기계가 아닌 사람이 보도록 만든 데이터’에서 폴 뮤를(Paul Murrell)은 이런 데이터를 추출해 사용하기 좋게 만드는 방법을 보여준다.

여러분이 만약 텍스트 데이터로 작업을 하고 있다면 조만간 인코딩 문제에 부딪히게 될 것이다. ‘4장 플레인 텍스트 속에 숨어있는 나쁜 데이터’에서 조쉬 레비(Josh Levy)는 텍스트 데이터에는 어떤 문제들이 기다리고 있고 그 문제들을 어떻게 다루면 되는지 설명한다.

마지막으로 아담(Adam Liacano’s)의 ‘5장 웹 데이터 (재)구성하기’에서는 웹 데이터 수집 시 겪을 수 있는 모든 문제를 보여준다.

기대와 다른 데이터

사람들은 온라인 리뷰에 거짓말을 남기기도 한다. 제이콥 퍼킨스(Jacob Perkins)는 사람들이 매우 특이한 방법으로 거짓말을 하는 것을 발견했다. ‘6장 거짓 리뷰와 헷갈리는 리뷰 찾아내기’를 보면 제이콥(Jacob Perkins)이 자연어 프로그래밍(natural-language programming, NLP)을 이용해 어떻게 이 같은 신종 거짓말을 탐지하는지 배울 수 있다.

데이터가 아무리 잘못 되더라도 의지할 수 있는 고유한 식별자가 있지 않을까? ‘9장 데이터와 현실이 다를 때’에서 스펜서 번즈(Spencer Burns)는 금융 시장에서의 경험을 토대로 앞선 질문이 항상 사실이 아님을 설명한다.

다른 접근

산업계는 계속 “데이터 과학자(data scientist)”라는 단어의 정확한 의미를 찾기 위해 애쓰고 있다. 적어도 소프트웨어 개발이 데이터 과학의 한 부분에 속한다는 의견에는 많은 사람들이 동의한다. ‘8장 피, 땀, 소변’에서 리처드 코튼(Richard Cotton)은 소프트웨어 개발자의 관점에서 이와 관련된 현명한 조언을 한다.

필립 제너트(Philipp K. Janert)는 ‘7장 나쁜 데이터는 일어나 주실래요?’에서 정말 나쁜 데이터라는 것이 있는지 묻고 있다.

여러분의 데이터에 문제가 있을 수도 있으며 여러분은 심지어 그 사실을 모를 수도 있다. 조나단 슈배비쉬(Jonathan A. Schwabish)는 ‘10장 탐지하기 어려운 편향과 오차’에서 문제를 일으킬 수 있는 데이터를 골라 내는 방법을 설명한다.

‘11장 너무 잘 하려다가 오히려 일을 그르친다: 나쁜 데이터가 정말 나쁠까?’에서는 브렛 골드스테인(Brett J. Goldstein)의 경험을 통해 지저분한 데이터를 통해 전통적인 통계 교육이 혹독한 현실을 직시할 필요가 있음을 보인다.

데이터 저장소와 기반 시설

데이터 저장 방법은 데이터 분석 방법과 많은 연관이 있다. 바비 노튼(Bobby Norton)은 ‘13장 웅크린 테이블, 숨겨진 네트워크’에서 관계형 데이터베이스에 갇힌 그래프 데이터 구조를 찾아내는 방법을 설명한다.

클라우드 컴퓨팅은 확장성과 유연성이 뛰어나 대규모 데이터 분석에 매력적이지만 결점이 없는 것은 아니다. ‘14장 클라우드 컴퓨팅 신화’에서 스티브 프란치아(Steve Francia)는 여러분이 잘못된 해결책을 찾지 않도록 클라우드와 관련된 가설을 해부한다.

우리는 NoSQL보다는 관계형 데이터베이스가 낫고, Couch보다는 Mongo가 혹은 하둡(Hadoop) 기반의 저장소가 다른 저장소보다 낫다는 식의 논쟁을 한다. ‘12장 데이터베이스의 공격: 파일을 고수해야 할 때를 위한 지침’에서 팀 맥나마라(Tim McNamara)는 좀 더 간단한 방법을 제안한다.

데이터의 사업적인 측면

때때로 데이터 과학자를 정규 직원으로 고용할 만큼 관련 일이 많지 않거나 혹은 회사 내에 없는 특별한 기술이 필요한 경우가 있다. ‘16장 기계 학습 전문가를 먹이고 돌보는 방법’에서 피트 워든(Pete Warden)은 기계 학습 작업을 아웃소싱하는 특별한 방법을 소개한다.

관료주의는 데이터 분석을 방해하는 장벽이 될 수도 있다. 마크 바이스만(Mark Vaisman)은 ‘15장 데이터 과학의 어두운 면’에서 여러분이 피해야 할 최악의 관행을 몇 가지 소개한다.

데이터 정책
여러분은 데이터를 처리할 때 자신이 어떤 방법을 사용하였는지는 확실히 알 것이다. 하지만 어떻게 최종 결과물이 나왔는지도 제대로 이해하고 있을까? 레이드 드레이퍼(Reid Draper)의 ‘17장 데이터 추적 기술’은 데이터 처리 과정에 대해 생각해볼 수 있는 기회를 제공한다.

내부에 있어야 할 데이터가 외부로 나왔다거나 삭제되었어야 할 데이터가 여전히 존재하는 경우처럼 데이터는 잘못된 장소에 있을 때 특히 더 문제가 된다. ‘18장 소셜 미디어: 지워지는 잉크?’에서 주드 바레스키(Jud Valeski)는 소셜 미디어의 미래를 살펴보고 데이터 리콜 기능의 필요성에 대해 고찰한다.

마지막으로 필자는 오랜 지지자인 켄 글리슨(Ken Gleason)과 함께 ‘19장 데이터 퀄리티 분석의 이해: 여러분의 데이터가 언제 충분히 좋은지 알기’를 집필하였다. 여기서는 케빈 핑크의 글을 보완하여 데이터의 퀄리티를 평가하고 퀄리티를 높이기 위한 시스템적인 방법을 설명한다.

회원리뷰 (6건)

매주 10건의 우수리뷰를 선정하여 YES포인트 3만원을 드립니다.
3,000원 이상 구매 후 리뷰 작성 시 일반회원 300원, 마니아회원 600원의 YES포인트를 드립니다.
(CD/LP, DVD/Blu-ray, 패션 및 판매금지 상품, 예스24 앱스토어 상품 제외)
리뷰쓰기

6명의 YES24 회원이 평가한 평균별점

리뷰 총점7.3/ 10.0
내용 내용 점수 편집/디자인 편집/디자인 점수 정보 더 보기/감추기 내용
0% (0건)
5점
83% (5건)
4점
17% (1건)
3점
0% (0건)
2점
0% (0건)
1점
편집/디자인
0% (0건)
5점
50% (3건)
4점
50% (3건)
3점
0% (0건)
2점
0% (0건)
1점

한줄평 (1건)

1,000원 이상 구매 후 한줄평 작성 시 일반회원 50원, 마니아회원 100원의 YES포인트를 드립니다.
(CD/LP, DVD/Blu-ray, 패션 및 판매금지 상품, 예스24 앱스토어 상품 제외)
0/50

배송/반품/교환 안내

배송 안내

배송 안내
배송 구분 YES24 배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4

반품/교환 안내

※ 상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내
반품/교환 방법
  •  마이페이지 > 반품/교환 신청 및 조회, 1:1 문의, 고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
맨위로
예스이십사(주)
서울시 영등포구 은행로 11, 5층~6층(여의도동,일신빌딩) 대표 : 김석환   개인정보보호책임자 : 권민석 yes24help@yes24.com 사업자등록번호 : 229-81-37000   통신판매업신고 : 제 2005-02682호 사업자 정보확인 호스팅 서비스사업자 : 예스이십사(주)
고객만족센터 T.1544-3800
상담 전화번호
  • 중고샵 문의 1566-4295
  • 영화예매 문의 1544-7758
  • 공연예매 문의 1544-6399
1:1 문의하기 자주 묻는 질문 상담시간 안내
YES24 수상내역 정보보호 관리체계 ISMS인증획득 개인정보보호 우수사이트
소비자피해보상보험 서울보증보험
고객님은 안전거래를 위해 현금 등으로 결제 시 저희 쇼핑몰에서 가입한 구매안전서비스를 이용하실 수 있습니다. 서비스가입사실 확인
EQUUS15