Oct 19th Journal Club

Themes: Global/Local Processing, Symbolism, Capturing and Representing of Laughter  

Presenters: IJ (Inju Lee), HM (Hoyoung Maeng), YK (YoonKyung Lee)


Topic 1: Global/Local Processing [IJ]

선정 이유: 시각 자극 처리 수준(global vs local)에 있어 정서(mood)의 영향을 다룬 가장 기본적인 연구에 대해 읽어보고 싶어 선정하였다.

내용 요약: 정서는 우리가 세상을 바라보고 처리하는 방식에 영향을 줄 수 있다. Affect-as-Information Approach에 따르면 정서적 감정(affective feelings)은 접근 가능한 지식(accessible knowledge)의 가치에 대한 정보로서 경험되며, 긍정정서가 부정정서보다 접근 가능한 지식에 대한 더 많은 의존(reliance)를 유도한다.
기존 연구 결과들에 따르면, global processing과 local processing을 비교했을 때 global processing이 더 규범적이고 쉽게 접근 가능한 정보 처리 전략이며, 따라서 사람들은 긍정정서 일수록 세부적인 정보보단 전반적인 정보에 더 의존하여 자극을 처리하게 된다. 이와 같이 정서 감정이 과제 관련 정보로서 경험될 때 정서는 정보가 처리되는 수준(global vs local)에 영향을 미치며, 긍정정서에 있을수록 사람들은 더 전반적인 정보에 더 의존하여 자극을 처리하게 된다. 이는 Clore 등(2001)의 Levels-of-Focus Hypothesis의 내용이며, 저자들은 이를 기반으로 연구를 진행하였다.
저자들은 정서가 global/local processing에 미치는 영향을 알아보기 위해 총 2번의 실험을 진행하였다. 첫번째 실험에선 구성적 기억(constructive memory)에 관한 Bartlett(1932)의 고전적인 실험에 있어 정서의 영향이 존재하는지 알아보았고, 두번째 실험에선 특정 기하학적 그림을 그 그림의 global/local shape으로 분류할 때 정서가 영향을 미치는지 알아보았다. 그 결과, 예상한 바와 같이 두 실험 모두 행복한 기분에 있는 사람들이 슬픈 기분에 있는 사람들보다 더 전반적인 정보에 의존하여 자극을 처리하는 것으로 나타났다.

의의: Affect-as-Information Approach가 global/local processing에도 동일하게 적용되는지 알아본 연구다.

비고: Global/local Processing의 정도를 측정한 task를 파일럿 실험에 이용해 볼 계획이다.


Gasper, K., & Clore, G. L. (2002). Attending to the big picture: Mood and global versus local processing of visual information. Psychological science, 13(1), 34-40.


Topic 2: Symbolism [YK]

선정이유: 인공지능이 과학으로써 자리잡고 발전하려면 어떻게 해야할지에 대한 ‘기호주의’ 컴퓨터공학자 관점에서 풀어쓴 글이어서 흥미로워 보였음.

내용요약
이 논문에서는 Intelligent Behavior가 무엇인지 에대한 논의부터 시작한다. AI는 단순히 기술을 떠나서 과학의 한 방법론으로 자리 잡아야 한다고 주장한다. 이를 위해 우리가 현재 던지고 있는 질문은 기술 구현을 위함일 뿐, 과학을 위한 질문을 던지고 있지 않다. 그리고 AI는 지능적인 ‘행동’ 자체에 대해 연구하는 학문이며, ‘행동’의 주체 (사람)에 대해 연구하는 분야와는 차이가 있다고 주장한다. 1.1. Anwersing questions에서는 사람이 한 번도 들어보지 못한 (상식선을 벗어난) 질문을 보고서도 대답할 수 있듯이 AI도 이러한 ‘행동’을 구현할 수 있어야한다고 주장한다 (answer one-shot questions). 2.Behavioural tests에서는 Turing Test부터 시작된 AI의 행동에 대해 측정하는 방법에 대해 비판한다. 즉, 이 테스트를 통과했다고 해서, 지능이 높다 낮다라고 결론지을 수 없을 뿐더러, 해당 테스트를 통과할 수 있을 정도의 지능이 있다-라고 표현하는게 더 정확하다는 것이다. 2.2. Cheap tricks에서는 휴리스틱만 사용해도 (즉, 질문에 대해 곰곰히 생각하지 않아도 오답은 면할 수 있는) 풀 수 있는 질문을 피하는 방법에 대해 소개한다. 그 방법은 1)질문을 Google-proof하게 만드는 것이며, 2) 간단한 패턴 반복에 지나지 않는 단순 질문을 피하고, 3) 문법적 구조나 통사 구조를 바꿈으로써 의미가 바뀌는 등의 bias를 피하는 것이다. 본 페이퍼에서 소개하는 더 ‘적절한’ 측정 방법은 Winograd schema questions이다. Winograd schema question은 질문에 대해 두개의 보기만 주어진다. 이 보기는 지문에 언급되어 있는 주체들이다 (남성, 여성, 사물, 집단 등). 대명사를 활용하여 주체들에 대한 질문을 던진다 (그, 그녀, 그것, 그들). 질문은 항상 동일하다 (대명사가 뜻하는 바가 무엇인가?) 질문은 목적에 따라 바꿀 수 있도록 special word의 자리가 따로 있다 (즉, 그 단어만 바꾸면 다른 것/사람을 지칭하는 질문이 됨으로써 질문의 의미가 달라진다). 4.4. Radical approach에서는 AI시스템이 ‘상식’ 지식이 풍부하다는 가정 하에 새로운 질문이 들어왔을 때 이를 ‘적용’할 수 있는 능력이 있다고 가정한다. 이때, 이를 확인할 수 있는 방법에 대해 제안하는데, 크게 ‘knowledge base’, ‘reasoning’, ‘answering questions’로 나눌 수 있다. 이는 MIT의 초기 기호주의 AI 학자인 John McCarthy에 의해 제안된 방법으로 알려져 있다.

장단점: 지능적인 ‘행동’의 주체에 대해 다루지 않는다고 주장했는데, 이 부분에 대해서는 조금 동의하기가 어렵다. 행동의 원인을 알기 위해서는 주체의 성격, 의도에 대해 파악이 우선 되어야한다고 생각하기 때문이다. 결국, 불가분의 관계로 생각된다.

의의: 현 AI 연구자들이 주로 radical idea를 쉬운 방법으로 파는 것 보단, 반대로 쉬운 idea(손글씨 인식, 얼굴 인식 등)를 radical한 model로만 풀고자 하는 접근에 대해 비판한다. 모든 문제를 풀 수 있는 궁극적인 모델이란 것은 없으며, 이를 추종하는 serial silver bulletism을 비판한다. 이를 피하기 위해서는 다음과 같은 knowledge representation 분야의 동료에게 ‘조언’을 했다: 1)연구의 시작과 끝은 언어에 있다, 2) 영어를 단순한 텍스트로 다룰 것이 아닌, 복잡한 지식을 이 단순한 구조를 통해 어떻게 표현하고 연구할 수 있을지에 대해 고민이 필요하다, 3) 정보의 활용(‘use’)에 초점을 두어야한다.


Levesque, H. J. (2014). On our best behaviour. Artificial Intelligence, 212, 27-35.


Topic 3: Capturing and Representing of Laughter [HM]

선정이유: 직접 웃음 데이터를 모아서 관련 실험을 해보는 연구를 확인하고 싶었다.

내용요약
웃음을 capturing 하고 물질적인 형태로 표현하여 들려주는 연구이다. 웃음은 인간의 삶에서 근본적이고 유비쿼터스 적이지만, 동시에 웃음이 발생한 직후 일시적으로 존재하며 곧 사라지는 특성이 있다. 옛날 앨범에 있는 사진을 보면서 과거를 추억하고 뭉클함을 얻는 것처럼 웃음도 그러한 것이 가능할까라는 물음으로 시작되었다.

  1. Capturing
    실험자들에게 직접 사랑하는 사람들과의 대화를 녹음하여 가져오게 한 후, 머신러닝 알고리즘을 통해서 웃음소리를 추출하였다.
  2. Representing
    향수병에 웃음소리를 담은 후 뚜껑을 열면 웃음소리가 나오고, 초콜릿을 먹으면 웃음소리가 나오게 만들어서 그때의 기분을 인터뷰함. 대부분 사랑하는 사람을 그리워하는 경향을 나타냄. 초콜릿을 먹을때도 유사한 결과가 많았으나, 간혹 초콜릿이 웃음소리에 방해되는 느낌도 받았다고 함. 결론적으로는 웃음은 오래 지속되는 형태를 부여할 수 있고 사람들이 개인적인 맥락과 사회적 맥락에서 과거의 기억에 대한 성찰에 역할을 할 수 있다는 것을 보여주었다.

장단점: 직접 실험자들의 웃음데이터를 녹음한 후 분석했던 점이 흥미롭다. 이를 위해 딥러닝 기법을 적용하여 최신 연구방향을 반영하는 논문이라고도 생각된다. 다만 연구의 전체적인 결론이 실험대상에 대한 인터뷰에만 초점이 맞혀있어 일반화 하기에는 다소 무리가 있을 수도 있을 것이라는 생각이 되었다. 또한 딥러닝 코드가 깃헙에 공개되어 향후 참고하면 좋을 것 같다.

의의: 하나의 연구 주제를 설정하고 실제 데이터를 모으는 방법에서 분석 방법에 이르기까지 자세하게 설명되어있어 신뢰 있는 논문이라 생각된다.


Ryokai, K., Durán López, E., Howell, N., Gillick, J., & Bamman, D. (2018). Capturing, Representing, and Interacting with Laughter. Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems - CHI ’18.