All | All

내돈내산 데스크톱 컴퓨터 조립 후기

Aug. 6, 2025, 11:07 p.m.
구매 금액은 235만원

이미 조립 되어있는 컴퓨터를 사서 업그레이드 하는 건 중학교 시절 부터 줄곧 해온 …

/media/images/2025-08-08/Screenshot_20250808_111352_Gallery.jpg

Neovim 셋업 툴 LazyVim 소개

March 29, 2025, 4:28 p.m.
vim-plug에서 Lua 기반 플러그인 매니저로 바꾸자

그동안 neovim 에서 vim-plug 으로 각 종 플러그인들을 설치해 사용하고 …


GAE 목적함수에서 TRPO 목적함수로의 유도과정과 개념적 이해

March 24, 2025, 4:22 p.m.
TRPO는 VPG 의 목적함수에 대해 이전 정책의 분포에 대한 식으로 치환하고, policy 변화에 제약을 건 방법

강화학습 TRPO 알고리즘에 유도과정을 복습하기 좋도록 ChatGPT 답변을 생성해…


RL기반 LLM Alignment tuning 방법론 중 하나인 DPO Loss 유도과정을 이해

March 17, 2025, 6:45 p.m.
DPO는 별도 보상모델 없이 정책모델의 확률분포 자체로 인간의 선호를 직접 학습


[SIGIR'21] Contrastive Learning for Sequential Recommendation

Feb. 18, 2025, 8:01 p.m.
세션기반 추천 모델에 contrastive learning loss 도입 하여 성능 향상을 이룬 논문

주어진 Session 에 대한 Representation 을 구할 때 유사한 ses…