반응형
빅데이터 분석기법에 대해서 알아보자
- R분석 및 파이썬 -
1. 파이썬
파이썬은 오픈소스 고급 프로그래밍 언어중 하나입니다.
파이썬의 장점
- 초보자뿐만 아니라 전문가 포함 매우 다양한 사용자층을 가지고 있으며, 플랫폼 자체가 매우 독립적입니다. 때문에 다양한 플랫폼에서 사용 가능하고 여러가지의 라이브러리가 제공됩니다.
- 중간의 컴파일 작업이 없어서 원하는 출력물이 빠르게 나온다.
- 코딩자체가 사람이 대화하는 형식과 아주 유사하여 이해하기 쉽고 C언어보다 빠르게 프로그램을 완성시킬 수 있다.
빅데이터 분석의 파이썬 활용
R분석 SAS 등 분석도구 보다 파이썬 언어는 비교적 단순하며, 데이터분석 라이브러리가 제공됩니다. 또한 기본적인 분석(정형화된 데이터)부터 비정형화된 데이터까지 많은 부분에서 활용할 수 있습니다.
파이썬을 빅데이터 분석도구로 배워야하는 이유
생산성 / 다용도, 다목적 사용가능
범용성 / 타언어의 기능활용
결함성 / 풍부한 커뮤니티 생태계를 보유
개방성을 보유한 분석도구
2. R분석
R분석은 통계처리를 위한 공개 소프트웨어 패키지로 가장 근래에 주목 받는 빅데이터 분석도구 입니다. (SW인 S를 바탕으로 개발되었고 다양한 통계기법으로 시각화 도구들을 제공하고 있습니다.)
R분석의 장점
자바(JAVA) 및 C언어, C++, 파이썬 등 다른 프로그래밍 언어와 쉽게 연동이 가능하다.
윈도우, 리눅스, 유닉스, 맥(Mac)등 대부분의 개발환경을 지원한다.
효율적이고 데이터의 시각화
R분석을 빅데이터 분석도구로 배워야 하는 이유
통계분석 분야에 특화되어 있는 빅데이터 분석언어.
통계 또는 처음 접하는 분들도 쉽게 접근할 수 있습니다.
기본적인 분석도구의 이해부터 머신러닝 및 시각화 등 학습 및 정용 할 수 있음.
R분석은 파이썬보다 통계에 특화된 패키지들을 많이 가지고 있다.
파이썬은 분석 툴을 만드는데 유용하다.
반응형
'빅데이터' 카테고리의 다른 글
텐서플로(Tensor Flow) 와 딥러닝을 위한 GPU 의미?? (0) | 2020.04.20 |
---|---|
하둡과 스파크 - 빅데이터 구축 플랫폼에 대해 알아보자 (0) | 2020.04.05 |
머신러닝 딥러닝 차이점 및 정의 (0) | 2020.02.20 |
미래유망직업 빅데이터전문가의 정의와 취업은? (0) | 2020.02.14 |