'데이터' 태그의 글 목록
본문 바로가기

데이터

Day 21. R 프로그래밍; 벡터; 리스트; 데이터 프레임; 자료 형태(mode) 벡터(Vector) 데이터 분석에서의 벡터 → 여러 개의 원소를 가지는 하나의 '변수' *벡터들은 동질적이다? 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드를 가짐 *벡터는 위치로 인덱스 된다? V[2]는 v벡터의 2번째 원소 *벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다? V[c(2,3)]은 v벡터의 2번째, 3번째 원소로 구성된 하위 벡터 *벡터 원소들은 이름을 가질 수 있다? V 더보기
Day 20. R 프로그래밍; 입력(Import)과 출력(Export) 입력과 출력의 과정 ↓ ↓ ↓ R에서 처리할 수 있는 데이터 타입 SAS / SPSS / Minitab / Stata / Keyboard / Sockets / Excel / netCDF / HDF5 / No SQL / MapReduce / Hadoop / Access / MySQL / MS-SQL / Sybase / DB2 / Oracle / Webscraping / XML / ASCII R에서 다룰 수 있는 파일 타입 Tab-delimited text / Comma-separated text / Excel file / JSON file / HTML file / XML file / Database / Statistical SW's file 기능 R 코드 비고 키보드로 데이터를 입력 (1) 데이터 양이 적.. 더보기
HBR Review 2. How AIG Moved Toward Evidence-Based Decision Making? 이번에 읽은 하버드비즈니스리뷰 레포트는 AIG 보험회사가 변화하는 기업 환경에 적응하기 위해 어떤 방법을 택했는지 보여주고 있습니다. 특히, 감성이나 직관에 의존하던 기존의 의사결정방식을 쇄신하여, (AIG같은 정통 서비스 직종의 보험사라면 더더욱 직관에 의존을 했을텐데) 'Evidence-Based Decision Making'으로 진화하고 또 이 변화가 어떤 효과를 불러일으켰는지 알 수 있었습니다. hbr.org/2014/10/how-aig-moved-toward-evidence-based-decision-making How AIG Moved Toward Evidence-Based Decision Making It started with the creation of a “Science Team.” h.. 더보기
Day 18. R 프로그래밍; 다운로드, 설치 용어 정리 *GUI : graphical user interface, 사용자가 컴퓨터와 정보를 교환할 때, 그래픽을 통해 작업할 수 있는 환경 *Package : R 함수와 데이터 및 컴파일된 코드의 모임 R 패키지 불러들이기 저는 웹을 통해서 R 패키지를 불러들였습니다! 'CRAN'에서 Windows, Mac 등 여러 버전을 제공하고 있으니 아래 주소에서 환경에 맞게 다운받으시면 됩니다. 저는 Windows 버전으로 다운로드를 하였고, 위의 아이콘이 32비트, 아래가 64비트 버전입니다. 패키지 도움말 -library(help=AID) : 다운로드 된 AID 패키지의 help 다큐먼트를 보여준다. -help(pakage=AID.. 더보기
Day 16. 분석 거버넌스(3) *목표 : 기업 경쟁력 확보를 위해 비즈니스 질문과 이에 부합하는 가치를 찾고 비즈니스를 최적화하는 것 *역할 : 기업 내 존재하는 빅데이터 속에서 Insight를 전파하고 이를 Action화 하는 것 *구성 : 기초통계학 및 분석 방법에 대한 지식과 분석 경험을 가지고 있는 인력 *분석을 위한 3가지 조직 구조 (DSCoE : Data Science Center of Excellence) *목표 : 기업 경쟁력 확보를 위해 비즈니스 질문과 이에 부합하는 가치를 찾고 비즈니스를 최적화하는 것 *역할 : 기업 내 존재하는 빅데이터 속에서 Insight를 전파하고 이를 Action화 하는 것 *구성 : 기초통계학 및 분석 방법에 대한 지식과 분석 경험을 가지고 있는 인력 *분석을 위한 3가지 조직 구조 (D.. 더보기
Day 12. 분석 프로젝트 관리 방안 분석 프로젝트 관리 파트는 제가 데이터사이언티스트가 된 것 같은 느낌이 들 만큼 굉장히 실용적인 내용이었습니다. 물론 준전문가 과정이니 상세하게 배우지는 못할지라도 조금이나마 분석 프로젝트를 어떻게 진행해야 하는지 알 수 있었습니다. -분석 프로젝트는 다른 프로젝트 유형처럼 범위, 일정, 품질, 리스크, 의사소통 등 영역별 관리가 필수- + 분석과제관리 '5가지 주요 속성' 1. Data Size -분석하고자 하는 데이터의 양을 고려한 관리 방안 수립 필요- 2. Data Complexity -정형 데이터가 있을 수 있고, 비정형 데이터가 산재해 있을 수 있다. 분석 프로젝트를 진행할 때는 초기 데이터의 확보뿐 아니라 해당 데이터에 잘 적용될 수있는 분석 모델의 선정도 중요- 3. Speed -분석 결과.. 더보기
Day 11. 분석 과제 발굴, 상향식 접근법 하향식 접근법이 전통적인 접근법이었다면 상향식 접근법은 하향식 접근법의 한계를 보완하였다고 볼 수 있습니다. 명확한 분석 방향이 정해지지 않은 상태에서 방대한 데이터를 가지고 나름의 통찰력 있는 분석을 통해 결과를 도출해야 합니다. 이런 맥락이라면, 상향식 접근법은 빅데이터 시대에 어울리는 접근법이 아닐까 생각이 듭니다. -다양한 원천 데이터로부터 분석을 통하여 통찰력과 지식을 얻는 과정- *하향식 접근법의 한계를 극복 -하향식 접근법은 문제가 정형화되어 있고 문제해결을 위한 데이터가 완벽하게 조직에 존재할 경우에 효과적- -하향식 접근법은 솔루션 도출에는 유효 But, 새로운 문제 탐색에는 한계- (최근 복잡, 다양한 환경에는 적합하지 않음) *답을 미린 내는 것이 아니라 사물을 있는 그대로 인식하는 .. 더보기
Day 10. 분석 과제 발굴(2) 하향식 접근법 공부의 연장선 (2) 문제 정의 단계 -식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계- -필요한 데이터 기법을 정의- -정확하게 분석의 관점으로 문제 재정의하기- *요구사항 : 분석 수행하는 당사자의 관점과 문제 해결 시 효용을 얻을 수 있는 최종사용자의 관점 모두 고려 (3) 해결방안 탐색 단계 -데이터 분석 문제를 해결하기 위한 다양한 방안 모색- *고려사항 3가지 →기존 정보시스템의 단순한 보완으로 분석이 가능한가? →엑셀 등의 간단한 도구로 분석이 가능한가? →하둡 등 분산병렬처리를 활용한 빅데이터 분석 도구를 통해 보다 체계적이고 심도있는 방안이 있는가? *기존에 분석 역량을 가지고 있지 않다면? -교육 / 전문인력 채용 / 분석 전문업체 활용- -이들을 활용해 과.. 더보기