메인메뉴로 이동 본문으로 이동

lnb영역

OA

고객센터

02-6959-5779

ribbon@kitanet.or.kr

상담가능시간 : 평일 09:00~18:00
토/일요일 및 공휴일 휴무

컨텐츠 내용

  1. 수강신청
  2. 과정정보

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 2

과정 이미지
[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 2 과정정보
교육시간 20시간
수강기간 30일
강의구성 0차시
수강료 40,000원
과정소개

본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.

 

교육대상

1. 영어 자연어 처리 및 NTLK 패키지 학습에 부담을 가지는 학습자 

2. 빠른 시간에 NLTK 패키지 및 관련 라이브러리를 배우고자 하는 자

 

학습내용

1. 파이썬 코드로 n-gram 구현하기

2. nltk stopwords를 활용한 불용어 제거하기(1)

3. nltk stopwords를 활용한 불용어 제거하기(2)

4. nltk stopwords를 활용한 불용어 제거하기(3) - 주의사항 및 여러가지 참고사항

5. 한국어 불용어 제거하기

6. Stemming(스테밍)이란 무엇이고 왜 필요한가

7. Stemmer를 사용한 어간 추출

8. PorterStemmer vs LancasterStemmer 어간 추출 비교

9. 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용

10. 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 - 코드 실습

11. 주어진 텍스트로 부터 Stemming 처리하기 - LancasterStemmer 사용 - 코드 실습

12. lemmatization이란 무엇이고 단어의 기본형 또는 원형복원을 하는 방법

13. WordNetLemmatizer를 사용하여 단어의 기본형(표제어, 원형복원) 추출하기

14. WordNetLemmatizer에서 제대로 처리하지 못하는 단어들

15. 품사 정보를 제공하여 기본형(표제어) 추출

16. 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(1)

17. 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(2)

18. 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(3)

19. 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(4)

20. 구두점 제거 및 텍스트에서 비문자 빼고 문자만 출력하기

 

▶수료기준

항목

진도율

진행단계평가

최종평가

과제

수료점수

평가비율

100%

0%

0%

0%

60점이상

수료조건

80%

없음

없음

없음

※ 수료기준은 각 평가항목의 점수가 수료기준 점수 이상이고 총점이 60 이상이어야 합니다.

학습목표
-NLTK 패키지를 이용한 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 영어를 분석할 수 있도록 목표한다