본문 바로가기

전체 글

(185)
네이버 영화리뷰 감성분석하기 1. 데이터 준비와 확인 필요한 모듈 설치 !pip install konlpy # install mecab-python import os os.chdir('/content') !git clone https://bitbucket.org/eunjeon/mecab-python-0.996.git os.chdir('/content/mecab-python-0.996') !python3 setup.py build !python3 setup.py install 데이터 불러오고 확인 import pandas as pd import konlpy import gensim train_data = pd.read_table('.../ratings_train.txt') test_data = pd.read_table('.../rat..
[NLP] 자연어 전처리 : 토큰화 우리는 수많은 문장 속에서 살아갑니다. 친구에게 온 메세지, 지금 읽고 계신 이 글까지도 문장입니다. 이 모든 것들을 일상에서 자연히 발생하여 쓰이는 언어, 자연어(Natural language)라고 부릅니다. 자연어의 반대 말로 대표적인 것이 프로그래밍 언어(Programming language)입니다. 그렇다면 우리가 일상적으로 사용하는 자연어와 프로그래밍 언어 사이의 본질적인 차이가 무엇일까요? 형식 언어 이론에 따르면 자연언어 : 문맥 의존 언어 (context sensitive language) 프로그래밍언어 : 문맥 자유 언어 (context free language) 로 구분할 수 있습니다. 문맥 자유 언어란 문맥 의존 언어에 포함되는 개념이라 프로그래밍 언어도 자연언어 범주안에 들어 있습니..
판별식의 응용 이 게시물은 한양대학교 이상화 교수님의 선형대수 강의를 바탕으로 필기한 내용입니다.
[Python] 백준 파이썬 2798 블랙잭 https://www.acmicpc.net/problem/2798 2798번: 블랙잭 첫째 줄에 카드의 개수 N(3 ≤ N ≤ 100)과 M(10 ≤ M ≤ 300,000)이 주어진다. 둘째 줄에는 카드에 쓰여 있는 수가 주어지며, 이 값은 100,000을 넘지 않는 양의 정수이다. 합이 M을 넘지 않는 카드 3장 www.acmicpc.net # 백준 2798 블랙잭 n, m = map(int,input().split()) card = list(map(int, input().split())) sum_list = [] for i in range(n-2): for j in range(i+1, n-1): for k in range(j+1, n): sum = card[i] + card[j] + card[k] i..
판별식의 공식 이 게시물은 한양대학교 이상화 교수님의 선형대수 강의를 바탕으로 필기한 내용입니다.
[Python] 백준 파이썬 25501 재귀의 귀재 https://www.acmicpc.net/problem/25501 25501번: 재귀의 귀재 각 테스트케이스마다, isPalindrome 함수의 반환값과 recursion 함수의 호출 횟수를 한 줄에 공백으로 구분하여 출력한다. www.acmicpc.net # 백준 25501 재귀의 귀재 def recursion(s, l, r): if l >= r: return 1, l+1 elif s[l] != s[r]: return 0, l+1 else: return recursion(s, l+1, r-1) def isPalindrome(s): return recursion(s, 0, len(s)-1) t = int(input()) for i in range(t): s = input() answer = list(i..
행렬의 판별식 이 게시물은 한양대학교 이상화 교수님의 선형대수 강의를 바탕으로 필기한 내용입니다.
[Python] 백준 파이썬 18870 좌표 압축 https://www.acmicpc.net/problem/18870 18870번: 좌표 압축 수직선 위에 N개의 좌표 X1, X2, ..., XN이 있다. 이 좌표에 좌표 압축을 적용하려고 한다. Xi를 좌표 압축한 결과 X'i의 값은 Xi > Xj를 만족하는 서로 다른 좌표의 개수와 같아야 한다. X1, X2, ..., XN에 좌 www.acmicpc.net 첫 시도 # 백준 18870 좌표 압축 n = int(input()) x_list = input().split() x_list_2 = [] for i in range(len(x_list)): k = 0 for j in range(len(x_list)): if int(x_list[i]) > int(x_list[j]): k += 1 x_list_2.a..