Korea adventure guy
본문 바로가기

전체 글

Day 23. R 프로그래밍; 데이터 프레임; 자료형 데이터 구조 변환; 데이터 구조 변경 데이터 프레임 "데이터 프레임" -데이터에서 각각의 변수에 해당하는 열들의 모임- 기능 R 코드 비고 데이터 프레임 data.frame(벡터,벡터,벡터) 벡터들로 데이터셋 생성 레코드 생성 new 더보기
Day 22. R 프로그래밍; 데이터 구조; 여러 자료형태 다루기(벡터, 리스트, 행렬) 데이터 구조 학습 1. 단일값(Scalars) -R에서는 원소가 하나인 벡터로 인식 및 처리- 2. 행렬(Matrix) -R에서는 차원(dimension)을 가진 벡터로 인식- -텍스트마이닝과 소셜네트워크 분석 등에 활용- (2차원의 공간에 행렬을 펼친다고 생각하자) 3. 배열(Arrays) -행렬에 3차원 또는 n차원까지 확장된 형태- -주어진 벡터에 더 많은 차원을 부여하여 배열을 생성- *아래의 오류 이유 : 행렬이 만들어지려면 벡터 원소의 갯수가 만들려는 차원의 길이에 만족해야 함 *아래는 바른 예 4. 요인(Factors) -벡터처럼 생겼지만, R에서는 벡터에 있는 고유값(unique value)의 정보를 얻어내는 것을 말하는데, 이 고유값들을 요인의 수준(level)이라고 함- -요인의 두 가.. 더보기
Day 21. R 프로그래밍; 벡터; 리스트; 데이터 프레임; 자료 형태(mode) 벡터(Vector) 데이터 분석에서의 벡터 → 여러 개의 원소를 가지는 하나의 '변수' *벡터들은 동질적이다? 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드를 가짐 *벡터는 위치로 인덱스 된다? V[2]는 v벡터의 2번째 원소 *벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다? V[c(2,3)]은 v벡터의 2번째, 3번째 원소로 구성된 하위 벡터 *벡터 원소들은 이름을 가질 수 있다? V 더보기
Day 20. R 프로그래밍; 입력(Import)과 출력(Export) 입력과 출력의 과정 ↓ ↓ ↓ R에서 처리할 수 있는 데이터 타입 SAS / SPSS / Minitab / Stata / Keyboard / Sockets / Excel / netCDF / HDF5 / No SQL / MapReduce / Hadoop / Access / MySQL / MS-SQL / Sybase / DB2 / Oracle / Webscraping / XML / ASCII R에서 다룰 수 있는 파일 타입 Tab-delimited text / Comma-separated text / Excel file / JSON file / HTML file / XML file / Database / Statistical SW's file 기능 R 코드 비고 키보드로 데이터를 입력 (1) 데이터 양이 적.. 더보기
HBR Review 2. How AIG Moved Toward Evidence-Based Decision Making? 이번에 읽은 하버드비즈니스리뷰 레포트는 AIG 보험회사가 변화하는 기업 환경에 적응하기 위해 어떤 방법을 택했는지 보여주고 있습니다. 특히, 감성이나 직관에 의존하던 기존의 의사결정방식을 쇄신하여, (AIG같은 정통 서비스 직종의 보험사라면 더더욱 직관에 의존을 했을텐데) 'Evidence-Based Decision Making'으로 진화하고 또 이 변화가 어떤 효과를 불러일으켰는지 알 수 있었습니다. hbr.org/2014/10/how-aig-moved-toward-evidence-based-decision-making How AIG Moved Toward Evidence-Based Decision Making It started with the creation of a “Science Team.” h.. 더보기
Day 19. R 프로그래밍; 배치모드; 기초 코드; 연산자; 함수 생성 배치모드 1) 배치모드 기능 -사용자와 인터렉션이 필요하지 않는 방식으로 매일 돌아가야 하는 시스템에서 프로세스를 자동화할 때 유용- 2) 배치 파일 실행 명령 윈도우 도스창에에서 실행 $R CMD BATCH batch.R 3) Path 지정 "내컴퓨터(또는 내 PC)" 오른쪽 마우스 클릭 → 속성 → 고급시스템 설정 → 환경변수 클릭 → 변수명 path 클릭 → R프로그램의 실행파일의 위치를 찾아서 추가 → 저장 4) 배치파일 실행 윈도우 창의 batch.R 실행파일이 있는 위치에서 "R CMD BATCH batch.R" 실행 R 기초 코드 기능 R 코드 비고 출력1 print() 한 번에 하나의 객체만 출력 예) print(a) 출력2 cat() 여러 항목을 묶어서 연결된 결과로 출력 복합적 데이터 .. 더보기
Day 18. R 프로그래밍; 다운로드, 설치 용어 정리 *GUI : graphical user interface, 사용자가 컴퓨터와 정보를 교환할 때, 그래픽을 통해 작업할 수 있는 환경 *Package : R 함수와 데이터 및 컴파일된 코드의 모임 R 패키지 불러들이기 저는 웹을 통해서 R 패키지를 불러들였습니다! 'CRAN'에서 Windows, Mac 등 여러 버전을 제공하고 있으니 아래 주소에서 환경에 맞게 다운받으시면 됩니다. 저는 Windows 버전으로 다운로드를 하였고, 위의 아이콘이 32비트, 아래가 64비트 버전입니다. 패키지 도움말 -library(help=AID) : 다운로드 된 AID 패키지의 help 다큐먼트를 보여준다. -help(pakage=AID.. 더보기
Day 17. 데이터 분석 개요 데이터 분석 마스터플랜까지 배운 뒤, 이젠 본격적으로 분석 기술 및 기법을 배우게 됐습니다. 데이터 분석기법에는 무엇이 있는지 공부하였습니다 대기업은 데이터웨어하우스(DW)와 데이터마트(DM)를 통해 분석 데이터를 가져와 사용하는데, 신규 시스템 및 신규 자료의 경우, 기존 운영시스템(Legacy), 스테이징 영역(Staging area), ODS(Operational Data Store)에서 데이터를 가져와 DW에서 가져온 내용과 결합함. 또한, '정형화된 패턴 처리'가 요구되는데, 비정형 데이터 -DBMS에 저장됐다가 텍스트마이닝을 거쳐 데이터 마트와 통합- 관계형 데이터(소셜 데이터) -DBMS에 저장됐다가 사회 신경망분석을 거쳐 분석결과통계값이 마트와 통합- *텍스트마이닝 예 - 전자우편, SNS.. 더보기