mathQA 논문 후기

최대 1 분 소요

MathQA 데이터는 operation에 특화된 데이터.. 이로써 새로운 표현을 배울 수 있을 것이다라는 것.

수학 문제를 푸는 것은 자연어로부터의 중요한 정보를 추출할 수 있는 능력이 요구됨. solver는 문제들에서 중요한 문맥을 실행가능한 표현으로 바꿀 수 있어야 함.

문제에서 수식은 순서를 지니며 이를 유추하기 위해 도메인 지식(e.g. const_pi)들이 필요할 수 있음. 이 논문에서는 이러한 표현의 language를 사용하여 mathQA를 만듦.

현실에서 사용가능한 수학 문제를 해결하는 것은 수식을 기반으로 잘 표현이 되어진다. 이런 문제를 푸는 것은, 개체간의 관계 및 implied actions을 논리적으로 이해할 수 있는 능력이 사람과 nn에 모두 요구된다. 어쨌든, passage로부터 어떤 값이 중요한지 아닌지를 잘 구분할 수 있어야 한다.

figure 2를 보면, 값들이 나열되어 연속적으로 실행되어 문제를 풀 수 있다는 것을 알 수 있다. 그래서 논문에서 연속 연산 문제를 표현하기 위한 언어를 정의한다.

나머지는 그냥 저냥 한 내용

데이터셋에 대한 자세한 소개..

GRE가 뭘까. 그 정도 문제를 annotate 하는게 어렵고 시간걸린다고 함. 그래서 crowd sourcing 했다고..

모델

enc-dec 모델을 개발하여 단어로 된 문제를 해당하는 수식으로 이어줄 수 있도록 함. 오지선다형에 문제의 정답을 둠.

수학문제에서 수식을 나열하는 것을 NMT 문제로 보고, 문제 x에 수식 y가 맞아떨어진다고 가정함. y는 representation language가 갖고 있는 모든 가능한 수식 및 arguments임.

카테고리:

업데이트: