본문 바로가기

전체 글55

문과생을 위한 Git - 02. What is Git? 2020/02/07 - [분류 전체보기] - 문과생을 위한 Git - 01. Why Git? 02. What is Git? 더보기 1. Git은 버전 관리 시스템이라는데? 2. Git만의 특징 3. Git의 주요 동작 프로세스 1. Git은 버전 관리 시스템이라는데? 앞에서 짧게 Git이 버전관리 시스템이라고 짧게 설명을 하였습니다. 버전관리 시스템은 기본적으로 우리가 어떤 작업을 했을 때, 그것의 최종본만 가지고 있는 것이 아니라 그 이전에 작업하여 저장했던 각 수정본을 모두 보유하면서 필요할 때마다 이전 버전을 참고하거나 되돌릴 수 있게 하는데 목적이 있습니다. 우리는 스스로 이미 많은 곳에서 버전 관리를 해오고 있었습니다. 무슨 말이냐고 한다면 우리의 작업물 이름 뒤에 날짜나 버전 명 등을 입력하면.. 2020. 2. 7.
문과생을 위한 Git - 01. Why Git? 01. Why Git? 1. 커지는 협업의 중요성 Git은 어렵습니다. 짜증납니다. 하지만 오늘날과 같이 개발자는 물론 기획자, 디자이너들도 Git을 사용하는 시대가 됐습니다. 실제로 많은 분석 및 개발 프로젝트에서 효율적인 협업을 위해 Git을 사용하고 있습니다. 협업 (Collaboration) 많은 사람이 일정한 계획 아래 노동을 분담하여 협동적·조직적으로 일하는 것 일을 분담해서 하는 작업으로 분업이라고도 말합니다. 우리가 어떤 일을 하게 되면, 공통의 목표를 위해서 일을 쪼개고 각자의 역할과 업무 범위를 정하는 일을 하게 됩니다. R&R을 정하는 것입니다. 개발자가 아닌 일반인들도 협업을 위해 사용하게 되었으니... Git을 사용하긴 사용하는데 정확히 어떤 것인지, 어떻게 동작하는 것인지, 어떤.. 2020. 2. 7.
Pycon Korea 2019 - 뚱뚱하고 굼뜬 판다(Pandas)를 위한 효과적인 다이어트 전략 Efficient diet strategy for fat and slow pandas https://drive.google.com/open?id=12faqaslFIF-Sg_sU3jeGyauW5ClRqS8D 2019. 8. 17.
NTN으로 시작하는 자연어처리와 딥러닝 (4) - 모델 학습 『NTN으로 시작하는 자연어처리와 딥러닝』 지난 포스트에서는 NTN 모델이 신경망 아키텍처는 어떻게 생겼고, 그것을 구성하는 layer에 대해서 알아보았습니다. 이번에는 구축한 아키텍처와 layer를 어떻게 학습시키는지 머신러닝 프로세스를 중심으로 중요 학습 Techniques와 함께 알아보도록 하겠습니다. *핵심 개념에 대한 사전을 이전 포스트에 정의하였으니 먼저 보시는 것을 추천드립니다. NTN은 Neural Tensor Network의 약자로 스탠포드 대학교 교수인 Richard Socher (2013)가 "Reasoning With Neural Tensor Networks for Knowledge Base Completion"에서 지식을 넘어선 추론(Reasoning Over Knowledge)을.. 2019. 2. 22.
문과생을 위한 딥러닝 수학 - 핵심편 (1) 들어가며... 그동안의 바쁜 일정으로 인해서 2달 만에 포스팅을 하게 되었습니다... 다른 카테고리의 글들도 업데이트를 해야 하나 우선 가장 급하다고 생각하는 '수학'에 대해서 먼저 다루려고 합니다. 기초편에서도 말했듯이 데이터를 분석하거나 머신러닝, 딥러닝을 하기 위해서는 약간의 수학적 개념만 알아도 충분히 할 수 있지만 실무 프로젝트와 학업을 진행하면서 느낀 점은 수학적인 뒷밤침이 없다면 단순히 코드만 돌리고 결과만 확인하게 된다는 것입니다. 이는 모래 위에 쌓은 성과 같은 '사상누각'이라고 할 수 있습니다. 데이터 과학의 대부분은 우리 주변의 문제 'What'을 해결하고자 하지만 우리가 수행한 'How'에 대한 'Why'가 충분히 뒷받침 되지 않는다면 결과의 정확도나 해석의 타당성이 떨어집니다. 또.. 2018. 6. 20.
머신러닝 기초 (5) - Data Preprocessing 핵심 전략 우리가 주로 접하게 되는 Kaggle이나 기타 예제 데이터들은 이미 데이터가 정제된 상태로 아주아주 예쁜 데이터입니다. 하지만 실제 우리가 맞닥뜨리게 되는 데이터는 굉장히 raw~ 날 것입니다. 그래서 데이터를 정제하고 분석하기 위한 형태로 만드는데 많은 시간을 할애하게 됩니다. 앞에서 Pandas를 통해 정제된 데이터를 처리하는 방법에 대해서 다루었다면 이번에는 날 것의 데이터(?)를 어떻게 분석을 위한 데이터로 만드는지 한 단계 level을 내려와서 데이터 전처리에 대해서 다루어보고자 합니다. 앞에서 다루었던 Pandas의 여러 기능들을 사용한다면 이 장에서 배울 scaling 기법 등을 적용하기 훨씬 수월합니다. 하지만 시스템의 자동화 측면을 생각했을 때 우리는 Deployment(배치)를 항상 생.. 2018. 4. 3.
NTN으로 시작하는 자연어처리와 딥러닝 (3) - NTN 신경망 구조 파악 및 이론적 배경 탐색 『NTN으로 시작하는 자연어처리와 딥러닝』 이번 포스팅에서는 Neural Tensor Network를 좀 더 세부적으로 가능하면 심도있게 다루어보려고 합니다. NTN을 모델로서 표현하여 설명하고 가능한한 시각적으로 이를 다루도록 하겠습니다. 더불어 Network의 Layer로 사용한 function 들에 대한 설명과 그 이론적 배경 등을 소개하면서 NLP와 Deep Learning 내용을 다루려고 합니다. 핵심 개념에 대한 사전을 이전 포스트에 정의하였으니 참조하면 좋습니다. NTN은 Neural Tensor Network의 약자로 스탠포드 대학교 교수인 Richard Socher (2013)가 "Reasoning With Neural Tensor Networks for Knowledge Base Com.. 2018. 2. 14.
NTN으로 시작하는 자연어처리와 딥러닝 (2) - 일단 NTN 알기 : 새로운 사실의 발견 『NTN으로 시작하는 자연어처리와 딥러닝』 NTN을 통해 자연어처리(NLP)와 딥러닝을 알아보기 전에 NTN이 무엇인지 조금 더 알아야 NTN 모델에서 사용하는 자연어처리 개념과 딥러닝 기법들에 대한 이해가 가능할 것 같습니다. 이번 포스트에서는 NTN 모델이 무엇인지, 어떤 목적으로 만들어졌고, 활용될 수 있는지 등을 중심으로 개략적인 내용에 집중해서 소개하고자 합니다. 일단 Neural Tensor Network 무엇인지 알기Relation을 중심으로 텍스트 Entity들 간의 관계를 분석하는 NTN NTN은 Neural Tensor Network의 약자로 스탠포드 대학교 교수인 Richard Socher (2013)가 "Reasoning With Neural Tensor Networks for Kn.. 2018. 2. 7.
NTN으로 시작하는 자연어처리와 딥러닝 (1) - 핵심개념 살펴보기 『NTN으로 시작하는 자연어처리와 딥러닝』 개념을 이해하기 위해서 간단하게 짚고 넘어가고자 핵심 키워드와 용어 들을 정리하였습니다. 이후에 소개하게 되는 내용에 대한 간략하게 먼저 설명하는 것이므로 쭉 읽어보고 넘어가시면 됩니다. 일종의 부록 사전 느낌으로 정리하였습니다. NTN에서 다루는 NLP, Deep Learning 핵심 개념 NTN은 Neural Tensor Network의 약자로 스탠포드 대학교 교수인 Richard Socher (2013)가 "Reasoning With Neural Tensor Networks for Knowledge Base Completion"에서 지식을 넘어선 추론(Reasoning Over Knowledge)을 위해 제시한 딥러닝 모델입니다. 핵심 Keywords & .. 2018. 2. 7.