on
Jan 18th Journal Club
Themes: Analyzing Crawled Data, Topic Modelling, Hierarchical clustering, AI-Generated Art, Anthropomorphism, Responsibility of AI
Presenters: YWJ (Yoon Won Jeong), JP (Jae Eun Park)
Topic 1: Analyzing Crawled Data, Topic Modelling, Hierarchical clustering [YWJ]
선정 이유
온라인 소셜 미디어에서 수집한 외로움 텍스트 데이터를 분석하는 방법을 공부하던 중, 비슷하게 코로나 상황에서 사람들이 외로움을 자연어처리 기법으로 분석한 논문을 발견하여 선정하였다.
내용 요약
2020년 5월 1일부터 6월 1일 사이에 외로움 혹은 코로나19 키워드가 포함된 4492개의 트위터 게시물을 수집하여 토픽 모델링을 수행하였다. 그 결과 33개의 토픽들을 도출하였고, 이를 위계적 군집 분석(hierarchical clustering)을 적용하여 총 3개의 핵심 테마로 축약하였다. 3개의 테마들은 ‘코로나19로 인해 외로움이 공동체에 미친 영향’, ‘사회적 거리두기가 외로움에 미친 영향’, ‘코로나19로 인해 외로움이 정신건강에 미친 영향’으로, 시간의 흐름에 따른 변동 없이 꾸준히 언급되었으나 유럽 이용자들이 남긴 트윗에서는 ‘코로나19로 인해 외로움이 공동체에 미친 영향’ 테마에 대한 언급은 시간이 지날수록 급격하게 줄어들고 ‘코로나19로 인해 외로움이 정신건강에 미친 영향’에 대한 글들이 주목할 만하게 증가하였다. 또한, 작성자가 팔로워 수가 낮은 집단에 속할수록 ‘사회적 거리두기가 외로움에 미친 영향’에 대해 더 많이 언급했고, 팔로워 수가 높은 집단에 속할수록 ‘코로나19로 인해 외로움이 정신건강에 미친 영향’에 대해 더 많이 작성하였다.
장단점
어떠한 방식의 토픽 모델링을 사용했고, 어떠한 과정을 거쳐 해당 토픽 수를 최종 선택하였으며, 그러한 토픽 모델링 결과를 한 번 더 군집화하여 한 차원 더 높은 테마를 선정한 과정에 대해 설명이 부족한 점이 아쉽다.
의의
소셜 미디어로부터 수집될 수 있는 데이터가 외로움 척도 등과 같은 기존의 사회과학 방법론을 이용하여 얻은 데이터의 연구 대안으로 활용될 가능성을 보여주었다. 또한, 실시간으로 대량의 데이터를 수집할 수 있는 온라인 데이터의 장점을 살려 상향식(bottom-up) 정책 고안에 도움이 될 수 있을 것이다.
비고
위계적 군집 분석(hierarchical clustering): 이미 군집화된 클러스터들에 대해 클러스터 간의 유사성을 기반으로 클러스터들을 점차 합쳐 나가는 분석이다. 클러스터 간의 유사성을 어떻게 정의하는지 그리고 한 번의 몇 개의 군집을 합칠 것인지에 따라 결과가 달라진다. https://www.andrew.cmu.edu/user/georgech/95-865/Lectures/UDA%20Lecture%2006%20-%20Hierarchical%20Clustering,%20Topic%20Modeling.pdf
Koh, J. X., & Liew, T. M. (2020). How loneliness is talked about in social media during COVID-19 pandemic: text mining of 4,492 Twitter feeds. Journal of psychiatric research.
Topic 2: AI-Generated Art, Anthropomorphism, Responsibility of AI [JP]
선정이유
‘AI화가’, ‘AI 예술가’ 등 AI의 창작과 관련하여 진행되는 연구를 읽어보고자 선정함.
내용요약
AI 기술이 발전함에 따라 AI가 ‘창조한’ 작품이 등장하고 있다. GAN (Generative Adversarial Network)과 같은 머신러닝 알고리즘을 활용하여 생성된 작품이 경매에서 고가에 거래되기도 한다. AI의 미술작품을 다루는 기사들은 흔히 인공지능을 의인화하는 언어를 사용하여 AI가 작품을 창작했다고 묘사한다. 그러나 실제로 인공지능이 예술작품을 창작하는 데 있어서 다양한 주체가 관여하게 된다. 인공지능 알고리즘을 통해 작품을 생산한 ‘화가’, 인공지능 학습 데이터인 미술작품들을 그린 화가들과 이 그림들의 출처가 되는 데이터베이스, 인공지능 학습에 사용된 알고리즘을 만든 기술자와 이 알고리즘을 변형시켜 예술작품을 창작할 수 있도록 만드는 사람, 인공지능이 창작한 다양한 그림 중 좋은 질의 그림을 선정하는 큐레이터 등 인공지능의 예술작품에 기여하는 사람들이 매우 많다. 그렇다면 이러한 종류의 예술작품의 크레딧은 누구에게 주어져야 할지, 작품을 경매해서 나오는 수익은 누구에게 주어져야 할지에 대한 논의가 필요하다.
본 연구에서는 자율주행자동차(AV) 분야에서처럼 인공지능의 의인화 정도가 AI 예술작품 창작의 책임 및 공로가 누구에게 주어지느냐에 영향을 미치는지 알아본다. 첫 번째 연구에서 실험참여자들은 AI 미술작품 창작과정에 대한 글을 읽고 인공지능의 의인화 정도와 창작의 공로/책임이 누구에게 있는지 답한다. 이 때 참여자마다 인공지능의 의인화 정도가 매우 달랐으며, 인공지능을 더 의인화한 사람들이 AI에게 더 많은 책임을 부여했다. 구체적으로, 예술가(인공지능을 학습시켜 작품을 만든 사람), 큐레이터(예술작품을 선정한 사람), 기술자(알고리즘을 만든 사람), 대중(인공지능에 들어가는 작품을 만든 사람) 중에서 인공지능이 더 많이 의인화될수록 사람들은 대중과 기술자에게 더 많은 책임/공로를 부여했다.
실험2에서는 AI 미술작품 창작과정에 대한 글을 Tool condition과 Agent condition으로 나뉘어 글에서 묘사된 인공지능의 의인화 정도를 조작하였다. 이 때, AI가 agent로 묘사되었을 때 더 많은 책임/공로가 부여되었다. 또한 예술가의 책임이 더 낮게 평가되었으며 기술자에게 더 많은 공로가 돌아갔다. 전체적으로 모든 조건에서 참여자들은 예술가, 큐레이터, 기술자, 그리고 대중의 순으로 예술작품의 창작의 공로를 부여하는 경향이 있었다.
장단점
장점: 인공지능의 예술작품 창작과 책임/공로에 관한 시의 적절한 논의.
단점: AI 예술작품 창작에 사용된 작품의 원작자는 실험에 포함되지 않아, 원작자가 있는 작품을 바탕으로 인공지능이 학습했을 경우 실험 결과에 변화가 있을지 알아보면 좋을 듯함.
의의
AI의 예술작품 창작이라는 새로운 분야에서 AI의 responsibility, accountability와 anthropomorphism의 관계를 다룸.
Epstein, Z., Levine, S., Rand, D. G., & Rahwan, I. (2020). Who gets credit for AI-generated art?. Iscience, 23(9), 101515.