'STUDY/R을 활용한 머신러닝' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

관리 메뉴

목록STUDY/R을 활용한 머신러닝 (5)

RUBY

[R]3. 게으른 학습: 최근접 이웃 분류/k-NN알고리즘

-최근접 분류기를 정의하는 주요개념과 ‘게으른 학습자‘로 간주되는 이유 -거리를 이용한 두 예시의 유사도 측정방법 -k-NN이라 불리는 유명한 최근접 이웃 분류 적용방법 최근접 이웃 분류의 이해 ▶최근접 이웃 분류기 :레이블이 없는 예시를 레이블 된 유사한 예시의 클래스로 할당해 분류하는 특징 ▶응용분야 -정지 영상 및 동영상에서 광학 글자 인식과 얼굴 인식을 포함하는 컴퓨터 비전 응용 -영화나 음악 추천에 대한 개인별 선호 예측 -특정 단백질 및 질병 발견에 사용 가능한 유전자 데이터의 패턴인식 ▶유사한 클래스 유형의 아이템들이 상당히 동질적인 경향을 띨 때 ▶개념을 정의하기는 어렵지만 보면 뭔 지 알 때 ▶데이터에 잡음이 많고 그룹 간에 명확한 그룹이 없다면 클래스 경계 식별이 어려움 ..

STUDY/R을 활용한 머신러닝 2020. 8. 22. 00:00

[R] 1. 머신 러닝 소개_머신 러닝 기원/머신 러닝 사례/머신 러닝 윤리/기계학습 방법/R을 활용한 머신 러닝

-머신 러닝의 기원과 실용적인 응용 -컴퓨터가 데이터를 지식과 실행으로 변환하는 방법 -머신 러닝 알고리즘을 데이터에 매칭하는 방법 머신 러닝의 기원 인간은 태어나면서부터 데이터가 범람하기 시작하고 문자의 출현으로 인간의 관측이 기록되기 시작했다. 또한 전자센서의 발명으로 양적,질적 측면에서도 데이터가 기록되기 시작했다.전자 센서는 절대 쉬지않으며 판단이 인식을 왜곡하지 않는다. 데이터의 쇄도로 ‘빅데이터’시대로 접어든다고 하지만 이는 부적절하다. 현대의 차별점은 방대한 양의 기록데이터가 있다는 것과 컴퓨터로 직접 접근할 수 있다는 점이다. 머신 러닝은 데이터를 지능적인 실행으로 변환하는 컴퓨터 알고리즘의 개발에 관심을 갖는 연구분야이다. 가용데이터, 연산 능력, 통계적 방법이 필요하다. 데이터 마이..

STUDY/R을 활용한 머신러닝 2020. 8. 19. 00:00

[R]5. 분할정복: 의사결정 트리와 규칙 기반의 분류

트리와 규칙이 데이터를 관심있는 세그먼트로 ‘탐욕스럽게 ’ 분할하는 방법 C5.0, 1R,RIPPER 알고리즘을 포함하는 가장 보편적인 의사결정 트리와 분류 규칙 학습자 위험 은행 대출과 독버섯 식별과 같은 실제 분류 작업을 수행하기 위한 알고리즘 사용 방법 의사결정 트리의 이해 ▶의사결정 트리 학습자 : 강력한 분류기, 특징과 잠재적 결과 간의 관계를 모델링 하기 위해 트리 구조 활용 ▶의사결정 트리 분류기: 예시를 최종 예측 클래스 값으로 보내기 위해 결정을 분기 시키는 구조를 사용한다. EX) 일자리제안 수락 여부에 대한 의사 결정 트리 root node(루트 노드): 고려중인 일자리 제안 decision node(결정 노드): 직업의 속성에 따라 선택이 이뤄짐 branches(분기): 결정의 잠재..

STUDY/R을 활용한 머신러닝 2020. 8. 17. 00:00

[R]4.확률적 학습: 나이브 베이즈 분류

확률의 기본 원리 R을 텍스트 데이터를 분석하는 데 필요한 특화된 방법과 데이터 구조 나이브 베이즈를 이용한 SMS 스팸 메시지 필터 구축 방법 나이브 베이즈 이해 ▶토마즈 베이즈 : 사건의 확률과 추가 정보를 고려 했을 때 확률이 어떻게 바뀌어야 만하는지 기본 원칙 개발, 베이지안 기법들의 기반 형성 ▶ 확률 : 0에서 1사이의 숫자로 가용한 증거를 고려해 사건이 발생할 가능성을 표현한 것 ▶베이지안 기법 기반의 분류기는 훈련 데이터를 활용해 특징 값이 제공하는 증거를 기반으로 결과가 관측될 확률을 계산 ▶베이지만 분류기 사용분야 -스팸 이메일 필터링과 같은 텍스트 분류 -컴퓨터 네트워크에서 침입이나 비정상행위 탐지 -일련의 관찰된 증상에 대한 의학적 질병 진단 베이즈안 기법의 기본 개념 ▶’사건(..

STUDY/R을 활용한 머신러닝 2020. 8. 13. 01:09

[R] 2. 데이터의 관리와 이해 | 벡터/팩터/배열/행렬/데이터프레임/R을 활용한 머신러닝

-데이터 저장에 사용하는 R의 기본 데이터 구조의 사용방법 -실용적인 내용으로 데이터를 R로 가져오고 R애서 내보내는 데 도움이 되는 함수 -복잡한 데이터를 이해하고 시각화하는 전형적인 방법 *R의 데이터 구조 1.vector 2.factor 3.array and matrix 4. data frame 1. Vector : element(항목)이라고 하는 값의 순서 집합(ordered set)을 저장한다. -백터 항목은 개수 제한이 없으며 모두 같은 타입이어야 한다. =숫자와 텍스트 동시에 가질 수 없음 -벡터 v의 타입 판단 typeof(v) -벡터 타입->①integer ②double ③character ④logical(True false) ⑤NULL(값이 존재하지 않음) ⑥NA(결측치)..

STUDY/R을 활용한 머신러닝 2020. 8. 13. 01:00

Prev 1 Next

목록STUDY/R을 활용한 머신러닝 (5)

RUBY

티스토리툴바