본문 바로가기

빅데이터7

책 헬로 데이터 과학 발췌 및 서평 『헬로 데이터 과학』 안녕하세요, 솬씨티입니다. '헬로 데이터 과학'이라는 책을 읽고 감명받은 부분을 쓰고, 데이터 과학에 관한 저의 생각을 쓰려고 합니다. 데이터 과학은 알면 알수록 기초에 충실해야하는 분야인 것 같습니다. 발췌한 부분은 기울여서 표시할테니 참고 바랍니다. * 문제 특성에 맞는 도구 선택 - 간단한 도구로 시작하여 복잡한 도구로 옮겨간다. - 분석 초반에 최대한 데이터 크기를 줄인다. ▶Opinion : 데이터 자체가 보통 방대하기 때문에 그것을 줄여 의미를 찾는 과정이 데이터 과학의 처음이자 끝이라고 할 수 있습니다. * 문제 해결 단계별로 적절한 도구들 (1) 데이터 준비 (하둡, 데이터 베이스) (2) 탐색적 데이터 분석 (엑셀, R) (3) 통계적 추론 / 예측 (파이썬, R) .. 2020. 7. 19.
개인 추천화 기능으로 데이블 창립한 이채현 대표 안녕하세요, 솬씨티입니다. 오늘은 주식회사 데이블이란 회사에 대해 알아보고자 합니다. 한마디로 데이블은 개인화 추천 및 네이티브 애드 플랫폼을 제공하는 회사입니다. 데이블 이채현 대표는 SK플래닛에서 데이블의 전신이라고 할 수 있는 ‘개인화 빅데이터 추천 플랫폼’을 개발했습니다. 그러다 SK플래닛의 ‘사내벤처’ 제도를 알게 되어 같은 뜻을 가진 2명을 모아 ‘레코픽’을 만들었다고 합니다. 하지만 본사 방침상 분사는 쉽지 않았고, 대신에 이채현 대표를 포함한 레코픽의 4명은 2015년에 사표를 내고 새로운 도전을 시작한 것이 데이블의 첫 출발입니다. 데이블은 또한 ‘개인화 기사추천’ 서비스를 가지고 있습니다. 현재 전 세계 미디어 1500곳이 데이블의 서비스를 활용하고 있을 정도로 그 영향력은 엄청납니다... 2020. 5. 21.
AI가 알려주는 비즈니스 전략, 서평 후기 안녕하세요, 솬씨티입니다. ^_^ 올 해 초에 샀던 『AI가 알려주는 비즈니스 전략』 책을 드디어 다 읽었습니다! 인스타그램에서 책 광고가 떠서 오 이거 재밌겠다! 하고 바로 구매했습니다. (이것도 결국 Conversion이 일어난거네요 ㅎ) 이직하고 나서 블로그도 시작하고 새로운 프로젝트에 벌써 투입되고 그러다보니 책을 따로 읽을 시간이 많이 부족했던 것 같습니다. 원래 마음이 있어야 시간도 있는 법이라는데..ㅎㅎ 지금보다 조금 더 부지런 떨어서 앞으로 IT 관련된 유익한 정보를 공유하는 솬씨티가 되겠습니다. 책은 AI 로봇인 에이미와 주인공 크리스와의 대화 형식으로 진행됩니다. 책 읽으면서 제가 감명 받은 부분이거나 따로 발췌하고 싶은 부분을 말씀드리겠습니다. "슈퍼 프레임워크는 속도, 이해, 성과,.. 2020. 3. 25.
[ML] 밑바닥부터 시작하는 머신러닝 Chapter 1-2 1-3. How to Learn Machine Learning 이번 시간에는 머신 러닝의 기본 Process에 대해 알아보겠습니다. 이렇게 이루어져있는데요. 기본적인 용어 설명을 먼저 해드리겠습니다. Model : 예측을 위한 수학 공식이나 함수를 뜻합니다. 형태는 간단하게 1차 방정식이나 확률분포 등의 형태로 표현됩니다. Algorithms : 어떠한 문제를 풀기 위한 과정을 뜻합니다. Model을 생성하기 위한 (훈련)과정이라고 생각하시면 됩니다. 위 설명처럼 중학교 때 배우는 1차 방정식 y=ax+b 도 머신러닝의 Model로 구현될 수 있습니다. 여기서 y는 예측값(prediction value) a,b는 알고리즘(algorithms)의 변수 x는 New data로 볼 수 있습니다. 이해하기 쉽도.. 2020. 3. 10.
한국의 넷플릭스, 왓챠 대표 박태훈 강연 후기 안녕하세요, 솬씨티입니다. 오늘은 한국의 넷플릭스 아니, 향후 넷플릭스를 뛰어넘으려 하는 왓챠 플랫폼에 대해서 말씀드리고자 합니다. 한국데이터산업진흥원에서 주최한 2019 데이터 그랜드 콘퍼런스에 다녀온 후기입니다. 평소 데이터에 관해 관심이 많았을뿐더러 왓챠 박태훈 대표님이 직접 연사를 맡는다는 소식에 기쁜 마음으로 참석했습니다. 박태훈 대표의 강연은 현재 최고의 플랫폼인 구글과 왓챠와의 Mission / Goal / Monetization의 비교로 시작되었습니다. 왓챠의 궁극적인 지향점은 단순한 검색이라기보다는 개인화에 최적화된 검색 엔진을 지향한다는 점이 구글과의 큰 차이점이라고 할 수 있습니다. 왓챠와 왓챠 플레이는 약간의 차이점이 있습니다. 왓챠는 위 사진의 장표 내용처럼 "문화 취향 기록 및 .. 2020. 3. 9.
[ML] 밑바닥부터 시작하는 머신러닝 Chapter1_1 - Introduction to ML 안녕하세요 솬씨티입니다 ^_^ 제가 기발자를 꿈꾼다는 건 저번에 말했었죠? 특히 데이터 사이언스 쪽으로 관심이 많은데요. 이번주부터 인프런에서 최성철 교수님의 밑바닥부터 시작하는 머신러닝 강좌를 수강하였습니다. 강의비와 교재비에다가 제 미래를 투자한 것이죠 후후 천리길도 한걸음부터! 라고는 하지만.. 갈 길이 멀기에 차치하고 밑바닥부터 시작하는 머신러닝 입문 들어가기로 마음 먹었습니다 ^_^ 대학교 때부터 친하게 지낸 선배가 컴퓨터 공학과를 전공해서 벌써 국립대 정교수가 되었는데요! (대단...) 그 형한테도 커리큘럼 한번 상담 받고 인가 떨어지자마자 바로 착수하였습니다 ! 아, 참고로 저는 본전공이 경영학도에다가 복수전공이 스포츠레저학이어서 한 학습 내용을 다이브하는 것보다는 제가 배운 내용을 Top-.. 2020. 3. 5.