genBERT 논문 후기

최대 1 분 소요

표현식으로 치환해서 모델이 예측하게 하는 것은 여러 문제점이 따른다. 1) 수적 표현이 이산적이고 공간이 같이 커지는 상황에서 모델이 최적화하기 힘든 미분 불가능한 연산자를 사용하여 이런 공간을 찾는 것을 학습하여야 한다. 2) 수적 표현을 사용하지만 최종 output이 span 인 경우, 한계에 봉착한다.

또한, 기존의 LM 모델을 변형하여 numerical reasoning의 역할을 수행하는 head를 사용한 것들도 문제가 있다. 1) 숫자를 9까지 밖에 못 세며, 몇 개 안되는 수에 대해 연산이 가능하다. 2) 학습이 모든 표현에 대해 정답을 이끌어 내기 위한 최대의 확률을 배우기 때문에 지원 가능한 수적 연산의 공간을 늘리는 건 중요하지 않다. (아마 100, 10 그런 거인듯) 3) 문장과 수적 연산의 상호 작용이 있을 수 있기 때문에, 계산기를 모델 밖에서 사용하는 것은 제한적이다.

모델에서는, decoder의 source attention weight가 새로이 학습되는 것을 방지하기 위해 encoder의 self-attention weight를 decoder의 source-attention weight으로써 사용한다고 함.

Twitter Facebook LinkedIn

220406 mysql date 타입 쿼리를 만들자

1 분 소요

로그 결과를 기간 별로 찍는 일이 생겨 관련 자료를 검색해 보았다. 아무래도, 날짜를 date_format, 그리고 관련한 날짜 연산 함수를 사용하여 필터링한 후, 그것을 group by 함수로 엮어 한번에 조회가 가능한 것으로 보였다.

220405 git rebase 브런치 합치기

1 분 소요

rebase는 참 쓰기 어려운 깃 커맨드이다. 여러가지 브런치를 따서 작업을 하는 연습을 하고 있었는데, rebase라는 것을 알자마자 나는 언제든지 commit을 합칠 수 있는 기능

220402 핑테스트.. 미들웨어..

최대 1 분 소요

백엔드 서버가 안정된 상황을 갖도록 하기 위해서는, 연결된 서버 등에 의해 시간이 지연되면 안된다는 것을 깨달았다. 서비스에서는 nas 서버를 이미지 서버로 사용하여 자주 연결을 갖곤 하는데, 꺼져 있을 경우에 대한 대비책이 하나도 없다는 것을 깨달았다.

220401 elasticsearch bool 쿼리 검색법

1 분 소요

elasticsearch의 검색법을 드디어 이해한 듯 하여 정리 차원에서 적어보려고 한다. 우선, OR과 AND를 정확하게 사용하고자 한다면, bool query의 must와 should를 사용해야 한다.

BaeKwangho

genBERT 논문 후기

공유하기

참고

220406 mysql date 타입 쿼리를 만들자

220405 git rebase 브런치 합치기

220402 핑테스트.. 미들웨어..

220401 elasticsearch bool 쿼리 검색법