2022년 회고 및 요즘 생각들

Post thumbnail
Post thumbnail
작년 이맘때 쯤 처음으로 한 해를 정리하면서 블로그에 2021년 회고 포스팅을 했었다. 역시나 시간은 쏜살같이 흘러서 다시 52주 중 마지막 주를 맞이했다. 올해는 내 인생에서 가장 많은 기억들을 만들어낸 한 해였다. 9개월동안 11개 도시에서 생활하면서 추억도 많이 쌓았고, 계획에는 없었던 인연으로 내년을 준비하게 되는 기회도 되었다. [Read More]
Tags: LIFE DIARY

명품에 대한 단상

도대체 명품은 왜 이렇게 비쌀까?

Post thumbnail
Post thumbnail
야심차게 준비한 1년간의 여행이 시간의 파도를 타고 어느덧 종착을 향해가고 있다. 처음 인천 공항에서 비행기를 타던 날에 생각했었던 방대한 계획들은 현 시점에 와서는 착실히 실행된 녀석들과 여러 핑계로 미뤄지거나 포기된 녀석들로 나뉜다. 확실한 건, 그럼에도 불구하고 계획했던 경험의 양보다는 더 많은 경험을 쌓아왔다는 것이다. 당연하게도, 블로그에서 주로 포스팅하던 컴퓨터 공학이나... [Read More]
Tags: LIFE TRAVEL

애자일 이해하기.

What is Agile? Why Agile?

Post thumbnail
Post thumbnail
서비스 알파를 앞두고 이제 시각화된 제품이 조립되고 있으니 업무 방식을 개선하고 싶었다. 아직 아무 서비스가 없는 상태에서는 백엔드 프론트엔드가 각각의 파트들을 개별적으로 개발하고, 병합하는 것이 괜찮았다. 하지만 프로토타입이 나온 시점에서는 앞으로의 업무 효율을 높이려면 팀으로서 사용자 경험에 집중하고 두고 기능 단위의 업무를 산정해서 애자일하게 개발해야겠다는 생각이 들었다. 그런데 그 애자일.... [Read More]
Tags: DEVELOP STUDY

Qdrant

Vector Search Engine

Post thumbnail
Post thumbnail
Deep Learning 모델의 작동 과정에서는 보통, 갖가지 방법으로 Human Readable 데이터로부터 특징을 추출하여 Vector 형태로 표현한다. 이미지와 같은 정적 데이터에서는 Feature Extracting라고 하고, 텍스트나 오디오 같은 Sequential 데이터에서는 Embedding이라고 한다. 이렇게 변환된 Vector는 입력 데이터의 중요 특징을 숫자로 표현한다. [Read More]

출발.

2022년 디지털 노마드 체험

Post thumbnail
Post thumbnail
오늘, 인천에서 카타르 도하를 거쳐 터키 이스탄불로 날아가는 비행기 안에서 세번째 기내식으로 섭취한 느끼한 오믈렛이 문제 없이 소화되기를 희망하며, 쓰고 맛없는 커피 한잔을 앞에 두고 9개월간의 세계여행을 출발하는 소회를 남기고자 한다. [Read More]
Tags: TRAVEL LIFE

PEP-8

파이썬 코드 스타일 가이드

Post thumbnail
Post thumbnail
파이썬은 특정인 또는 집단이 언어 발전을 주도하기 보다는, 수많은 사람들의 의견을 청취하고 토론하며 수용하여 발전해왔다. 이 과정에서 사용자로부터 제안된 수많은 주제들을 PEP(Python Enhancement Proposals)라는 prefix가 붙은 문서로 관리하고 있다. [Read More]
Tags: DEVELOP STUDY

OCR 최신 동향

Post thumbnail
Post thumbnail
이번 포스트에서는 최근의 OCR 분야의 최신 동향을 알아보고 정리해보려고 한다. 전통적으로, OCR 분야는 대상에 따라 두 개의 영역으로 나누어져 왔다. 최근에는 Deep Learning 기반의 모델들이 SOTA 리스트를 거의 장악하게 되면서 대상간 방법론의 차이가 거의 없어지는 추세이며, Structured text의 경우 LaTeX 태그들을 포함하여 결과를 내도록 학습하는 차이가 있다. [Read More]

Poetry

파이썬 패키지, 의존성 관리 도구

Post thumbnail
Post thumbnail
최근에는 내가 다루는 거의 모든 프로젝트가 Python 기반이다 보니, 접하게 되는 라이브러리도 정말 다양하다. 그동안 anaconda를 통해 개발 과정에서의 dependencies를 관리했었는데, 개인 프로젝트에서는 크게 문제 없었지만 아무래도 pip과 conda를 혼용해서 패키지를 설치하다보니, 팀 프로젝트 운영에서 패키지의 버전 관리 및 공유가 매끄럽지는 못했다. [Read More]
Tags: DEVELOP STUDY

MongoDB, Not Only SQL

PyMongo, CRUD

Post thumbnail
Post thumbnail
RDBMS가 꽉 잡고 있는 DB시장에서 최근 그 존재감을 점점 더 키워가고 있는 NOSQL. 빅데이터에서 자주 쓰일 뿐만 아니라 MLOps에서 자주 언급되는 녀석인데, 대학생때 프로젝트에서 써본 이후로 한번도 제대로 들여다보지 않았던 것 같다. 이번 기회에 한번 mongoDB에 대해 다시 한번 알아보고 정리하고자 한다. 특히 PyMongo 위주로. [Read More]
Tags: DEVELOP STUDY

파이썬 tempfile

임시 파일과 디렉터리 생성

Post thumbnail
Post thumbnail
임시 파일은 프로그램 동작 중에 데이터를 임시적으로 보관하거나, 영구 파일을 생성하는 과정에서 사용된다. Word, Excel 같은 문서 편집기 뿐만 아니라 영상, 사진 등의 data를 생성하는 프로그램에서는 예상할 수 없는 오류에 의해 작업 중이던 정보를 잃어버리는 것을 대비하고, 작업 내용을 복원하기 위해 임시 파일을 이용한다. [Read More]
Tags: DEVELOP STUDY

오리지널스

어떻게 순응하지 않는 사람들이 세상을 움직이는가

Post thumbnail
Post thumbnail
언젠가 유튜브에서 지적 대화를 나누는 컨텐츠를 보다가 이 책 “Originals”가 “와비파커”와 함께 언급된 적 있다. 왠지 모르게 나도 알고 싶어져서 책을 주문해서 책상 위에 올려놓은지 꽤 시간이 지났다. 표지 위의 먼지가 점점 쌓여갈 때 쯤 드디어 집어들고 책장을 넘겼다. 하루 15분 책읽기 목표를 달성하기 위한 희생양으로 소모된 이 책을 기리며... [Read More]
Tags: LIFE BOOK

2021년 회고 및 요즘 생각들

Post thumbnail
Post thumbnail
중학교 3학년 때, 우리 반에 엄청 잘생긴 친구가 있었다. 뚜렷한 이목구비에 짙은 쌍꺼풀, 키는 나랑 비슷했지만 왁스로 멋있게 세운 헤어스타일은 평범한 나와는 달랐다. 서면 밀리오레에서 산 보세 스키니진을 입고 흰색 하이탑 신발을 신고 다니던, 온갖 멋있는 것이라곤 다 가지고 있던 그 녀석을 어쩌면 나는 처음부터 동경했던 것 같다. 왠지 느껴지는... [Read More]
Tags: LIFE DIARY

Dynamic Programming

동적 프로그래밍

학부 알고리즘 수업 때 처음 배웠던 동적 프로그래밍. 수업을 들으면서도 왜 이름이 동적 프로그래밍인지 점점 더 헷갈리게 되는 개념이었습니다. 결론적으로, 반복적으로 계산하게 되는 부분들을 저장해놓고, 다음 스텝의 계산에 이용하는 방법을 뜻하는 동적 프로그래밍을 오랜만에 다시 정리해봅니다. 기초적인 내용이라 쉽게 읽고 떠올릴 수 있도록 작성했습니다. [Read More]
Tags: STUDY DEVELOP

즉흥 제주 여행

feat. 테슬라 Model3

Post thumbnail
Post thumbnail
반복되는 업무에 스트레스를 받던 차, 아내와 리프레시를 목적으로 2021년 2월, 2박 3일 짧게 다녀온 제주 여행을 기록합니다. 작년에 신혼여행으로 마지못해 다녀왔던 제주에서의 추억이 기대했던 것보다 훨씬 만족스러웠기에, 다시 찾아오게 되기까지 오래 걸리지 않았습니다. 여행을 계획할 때마다 거들떠보지도 않던 제주였는데, 이렇게 좋은 여행지라는 것을 이제라도 알게되어 다행입니다. [Read More]
Tags: TRAVEL JEJU KOREA

나의 딥러닝 모델 Dockerize하기

Training Container

Post thumbnail
Post thumbnail
내가 구현한 딥러닝 모델을 Prediction API로 deploy하는 것은 크게 어렵지 않습니다. flask, fastapi 등을 이용하면 RESTful API로 쉽게 구현할 수 있습니다. 데모 수준에서 프로토타입을 만들 때는 매우 유용하지만, 하지만 실제 서비스에서는 cli로 실행하는 수준으로는 문제가 생길 수 있습니다. 요청 수에 유연하게 대처해야하는 상황에서는 서비스를 Dockerize할 필요가 있습니다. [Read More]

Slidev, 흥미로운 개발자들의 ppt 도구

open source

Post thumbnail
Post thumbnail
출근하고 커피 한 잔을 손에 쥐고 제일 처음 하는 일은 Github에서 follow 중인 개발 능력자분들이 어제 하루동안 어떤 repository에 ⭐를 찍었는지 feed를 확인하는 일입니다. 몇 주 전에 feed에서 slidev라는 오픈 소스를 발견하고 나서, 오늘 조금 남는 시간이 생겨 이 프로젝트를 유심히 들어다봤습니다. 이 프로젝트는 ppt를 작성하는 새로운 도구를 제공하는데, 여러... [Read More]
Tags: STUDY DEVELOP

Cosine Annealing Warm Up Restarts

with code

Post thumbnail
Post thumbnail
Optimzer의 Learning Rate을 관리하는 Scheduler를 이용하면 똑같은 환경에서도 조금 더 나은 학습 결과를 얻을 수 있습니다. pytorch에서 여러가지 종류의 Scheduler를 제공하니, 종류와 활용 방법을 체크하는 것이 좋습니다. https://sanghyu.tistory.com/113 블로그에서는 각 Scheduler의 Learning Rate 변화를 시각적으로 표현해주셔서 직관적으로 파악하는 것을 도와줍니다. 참고하시길 추천합니다. [Read More]

Nginx로 웹서빙

로드밸런싱, 포트포워딩

Post thumbnail
Post thumbnail
API로 개발되는 서비스를 바깥과 연결하는 관문으로 nginx를 자주 사용합니다. 조금만 배우면 사용이 간단하고, 강력한 기능을 제공하기 때문입니다. nginx는 웹 서비스와 관련된 매우 다양한 기능들을 제공하지만, 이번 포스트에서는 제가 일부 프로젝트에서 이용했던 로드밸런서와 포트포워딩을 정리해봅니다. [Read More]
Tags: STUDY DEVELOP

OCR 엔진 개발기

feat. open source

Post thumbnail
Post thumbnail
현업에서 일을 한지도 벌써 2년을 꽉 채웠습니다. 그동안 회사에서는 특히 OCR 관련 업무를 주로 진행했는데, 야외 환경(text in the wild)부터 고문서까지 다양한 환경에 대해 OCR을 적용하는 경험을 할 수 있었습니다. 최근에는 다양한 오픈 소스 레포지토리가 공개되어있어 논문을 읽으면 거의 곧장 실험 및 검증을 할 수 있는 코드로 접근이 가능합니다. 그동안의... [Read More]

알고리즘 트레이딩 준비하기 - 백테스팅

feat. Backtrader

Post thumbnail
Post thumbnail
Backtrader는 Quant Algorithm Trading에서 매우 중요한 Backtesting을 도와주는 오픈소스 라이브러리입니다. 직접 짠 매수매도 전략을 과거의 데이터에 시뮬레이션해보고 전략의 유효성을 실험하는데 이용합니다. 이 작업을 효율적으로 수행하기 위해 Backtrader에 적용된 몇가지 개념에 대해 정리합니다. 꽤나 정교하게 구성된 큰 라이브러리이기 때문에 이번 포스트에서는 사용 방법과 관련된 핵심적인 일부에 대해서만 다룹니다. [Read More]
Tags: LIFE DEVELOP

Machine Learning 분류 모델 선정하기

상황별

Post thumbnail
Post thumbnail
Machine Learning Project를 갓 시작하게 되었다면, 문제 해결을 위해 어떤 모델을 정해야할지 고민하는 단계가 가장 먼저 시작됩니다. 여기서 Machine Learning은 Deep Learning을 포함하는 더 큰 범주의 학습형 인공지능을 이야기합니다. http://blog.echen.me/2011/04/27/choosing-a-machine-learning-classifier/에 좋은 글이 있어 정리하려고 합니다. [Read More]

직장에서 써야할 대화 방법

feat. 포프TV

Post thumbnail
Post thumbnail
꽤 예전부터 Youtube에서 포프TV를 자주 보게 됩니다. 자타공인 최고 레벨 개발자 Pope님이 운영하는 채널인데, 개발과 관련한 이야기 뿐만 아니라 직장인으로서, 사회인으로서 가져야할 마인드에 대한 훌륭한 조언도 함께 다루고 있어서 참 괜찮은 채널입니다. 일하면서 음악을 듣다가 지치면, 가끔 라디오처럼 틀어놓고 듣기 좋습니다. [Read More]
Tags: LIFE BUSINESS IT

유용한 Linux snippets

Post thumbnail
Post thumbnail
처음 시작이 Windows였기 때문인지, 저는 OS로는 Windows가 좋습니다. 특히 Windows 10은 MS가 마지막 버전이라고 공표했듯, 완성형이라 생각합니다. 요즘에는 클라우드를 이용하는 일이 많다보니, 자연스럽게 데이터를 다루거나 모델 실험에도 리눅스를 자주 이용하게 됩니다. 그래도 개발과정은 vscode-insider를 통해 윈도우 환경과 똑같이 세팅하기 때문에, 컴퓨터를 전공했음에도 사실 리눅스 OS가 완전히 익숙하지는 않습니다. 머릿속에는 정말... [Read More]
Tags: DEVELOP LINUX

Interview Question & Answer

출근 루틴, 하루 3문제

Post thumbnail
Post thumbnail
항상 양질의 글을 읽을 수 있어 즐겨찾는 zzsza(변성윤)님의 블로그에서 Datascience-Interview-Questions 포스트를 발견했습니다. 공유되어 있는 양질의 문제들을 보며 출근 루틴으로 2~3문제씩(현실은 1문제씩..) 답안을 만들어야겠다는 생각이 들었습니다. 원문에는 다양한 도메인에 대한 질문들이 있는데 그 중, 관심을 가지고 있는 몇 가지 주제에 대해서 공부하고 나름대로 답안을 작성하여 기록하고자 합니다. [Read More]

Image Attention 정리

feat. Pytorch

Post thumbnail
Post thumbnail
이미지 분석에서 Attention의 부산물인 Score를 이용하면 네트워크가 집중(Attention)하고 있는 영역을 시각적으로 표현 가능합니다. 이를 참고하면 네트워크의 동작을 조금 더 직관적으로 이해할 수 있습니다. Attention은 Soft Attention과 Hard Attention으로 나뉘는데, 이번 포스트에서는 거의 대부분의 Image Attention에서 이용하는 Soft Attention에 대해 코드와 함께 간략하게 정리해보려고 합니다. [Read More]

이미지 전송 REST-API 서버 구축

feat. django-rest-framework

Post thumbnail
Post thumbnail
AI 연구 개발 뿐만아니라 Front Serving까지 아우를 수 있는 풀스택 AI 개발자의 포지션을 목표하고 frontend의 이것저것 열심히 공부하고 있습니다. 이번 포스팅에서는 올 상반기에 회사에서 연구, 개발했던 OCR 엔진을 웹에서 서비스하기 위해 Django 기반의 REST-API 서버를 만들면서 배운 내용을 정리해봅니다. [Read More]
Tags: DEVELOP