본문 바로가기

전체 글

(185)
your first NLP competition submission 본 게시물은 캐글 노트북을 바탕으로 작성되었습니다. 노트북을 보며 필사하면서 간단한 번역, 코드 리뷰를 작성했습니다. Text classification step by step 자연어 처리(NLP)는 컴퓨터 과학, 인공 지능, 정보 공학, 그리고 인간-컴퓨터 상호작용 분야의 하위 분야입니다. 이 분야는 컴퓨터가 어떻게 엄청난 양의 자연어 데이터를 처리하고 분석하는지에 초점을 맞추고 있습니다. 언어를 이해하고 읽는 과정은 언뜻 보기에는 쉬워 보이지만 생각보다 더 복잡합니다. 목표 이번 커널의 목표는 다음과 같습니다. 기본적인 EDA 데이터 정제에 대한 기본 가이드 특징 분석과 추출 모델링과 평가지표 결과 제출 목차 Introduction 데이터 소개 Load and Check Data 라이브러리 불러오기 ..
일반최소제곱과 QR분할 / 함수공간 이 게시물은 한양대학교 이상화 교수님의 선형대수 강의를 바탕으로 필기한 내용입니다.
[Python] 백준 파이썬 10814 나이순 정렬 https://www.acmicpc.net/problem/10814 10814번: 나이순 정렬 온라인 저지에 가입한 사람들의 나이와 이름이 가입한 순서대로 주어진다. 이때, 회원들을 나이가 증가하는 순으로, 나이가 같으면 먼저 가입한 사람이 앞에 오는 순서로 정렬하는 프로그램을 www.acmicpc.net # 백준 10814 나이순 정렬 n = int(input()) i = 1 # 1 가입 순서 user_list = [] for _ in range(n): age, name = input().split() user_list.append([int(age), name, i]) # 2 i += 1 user_list.sort(key = lambda x : (x[0], x[2])) # 3 for i in user_..
벡터투영과 최소제곱법/1차연립방정식 풀이와 직교벡터 구하기 이 게시물은 한양대학교 이상화 교수님의 선형대수 강의를 바탕으로 필기한 내용입니다.
[Python] 백준 파이썬 1181 단어 정렬 https://www.acmicpc.net/problem/1181 1181번: 단어 정렬 첫째 줄에 단어의 개수 N이 주어진다. (1 ≤ N ≤ 20,000) 둘째 줄부터 N개의 줄에 걸쳐 알파벳 소문자로 이루어진 단어가 한 줄에 하나씩 주어진다. 주어지는 문자열의 길이는 50을 넘지 않는다. www.acmicpc.net 중복 단어 제거 길이 순 정렬 후 사전 순 정렬 이 두가지 과정으로 진행하면 됩니다. import sys n = int(input()) word_list = [] for _ in range(n): word = sys.stdin.readline().strip() word_len = len(word) if [word_len, word] not in word_list: word_list.ap..
Chapter 7. 합성곱 신경망(CNN) 이 게시물은 밑바닥부터 시작하는 딥러닝 1권을 바탕으로 작성되었습니다. 이번 장의 주제는 합성곱 신경망(convolutional neural network, CNN)입니다. 전체 구조 지금까지 본 신경망은 인접하는 계층의 모든 뉴런과 결합되어 있었습니다. 이를 완전 연결(fully-connected, 전결합)이라고 하며, 완전히 연결된 계층을 Affine 계층이라는 이름으로 구현했습니다. 완전 연결 신경망은 Affine 계층 뒤에 활성화 함수를 갖는 ReLu 계층(혹은 Sigmoid 계층)이 이어집니다. CNN의 구조는 다음과 같습니다. CNN에서는 새로운 합성곱 계층(Conv)과 풀링 계층(Pooling)이 추가됩니다. CNN의 계층은 ‘Conv-ReLu-(Pooling)’ 흐름으로 연결됩니다.( 풀링..
Chapter 5. 오차역전파법 이 게시물은 밑바닥부터 시작하는 딥러닝 1권을 바탕으로 작성되었습니다. 계산 그래프 계산 그래프(computational graph)는 계산 과정을 그래프로 나타낸 것입니다. 계산 그래프는 복수의 노드(node)와 에지(edge)로 표현됩니다. 그럼 간단한 문제를 계산 그래프를 이용해 풀어보겠습니다. 문제 1 : 현빈 군은 슈퍼에서 1개에 100원인 사과를 2개 샀습니다. 이때 지불 금액을 구하세요. 단, 소비세가 10% 부과됩니다. 그림에서 처음에 곱셈 노드에 사과 1개의 가격과 사과의 개수가 입력으로 들어갑니다. 그에 대한 출력이 200으로 나오게 되고, 그 출력과 소비세 10%에 관한 값이 다음 곱셈 노드의 입력으로 들어가고 최종 지불 금액이 계산됩니다. 이처럼 계산 그래프를 그려서 왼쪽으로 오른쪽..
Chapter 4. 신경망 학습 이 게시물은 밑바닥부터 시작하는 딥러닝 1권을 바탕으로 작성되었습니다. 이번 장의 주제는 신경망 학습입니다. 여기서 학습이란 훈련 데이터로부터 가중치 매개변수의 최적 값을 자동으로 획득하는 것을 뜻합니다. 이번 장에서는 신경망이 학습할 수 있도록 해주는 지표인 손실 함수를 소개합니다. 이 손실 함수의 결괏값을 가장 작게 만드는 가중치 매개변수를 찾는 것이 학습의 목표입니다. 손실 함수의 값을 작게 만드는 기법으로 함수의 기울기를 활용하는 경사법도 소개합니다. 훈련 데이터와 시험 데이터 기계 학습에선 데이터를 훈련 데이터와 시험 데이터로 나눠 학습과 실험을 수행하게 됩니다. 훈련 데이터를 이용해 모델 훈련을 하고, 시험 데이터로 테스트를 보는 것입니다. 이렇게 하는 이유는 우리가 원하는 것은 새로운 데이터..