Data Science!/이론

중학생도 이해할 수 있는 AI 이야기 - AI 가 손을 못 그리는 이유 딥러닝 vs 머신러닝

양국남자 2023. 5. 18. 05:30

알파고 쇼크 뒤 몇년이 지났는데도 딥러닝과 머신러닝의 차이를 잘 이해하지 못해서 제게 물어보시는 분들이 계십니다.

 

흔히 딥러닝을 사람들이 언급할때 자주 하는 말이 '사람의 생각을 본따' 라고 하는데, 이 말을 통해서 설명해드릴게요.

 

머신러닝은 학습할 때 특정 수치를 받습니다. 딥러닝은 결국 숫자로 변환하긴 하지만, 이 수치가 뭔지 직접 사람이 가르치지는 않습니다.

 

잘 안 와닿으신다고요? 그렇다면 이렇게 생각해 봅시다.

 

AI에게 포메라니안과 (재패니즈) 스피츠를 구분하도록 학습시킨다 해봅시다.

 

덩치는 매우 차이나지만 실제로 많이 헷갈려서 사기분양도 있다고 하는 두 견종입니다.

머신러닝의 경우 몸무게, 모색(물론 숫자코드로 받습니다), 체고, 머즐길이 등 수치를 받습니다.  블랙탄, 갈색 스피츠나(적어도 재패니즈 스피츠가 대다수인 한국에서는) 5키로가 넘는 포메라니안은 보신 적이 없을겁니다 (그런애들은 폼피츠라고 하죠).

 

하지만 우리가 스피츠랑 포메라니안을 구분 할 때 그렇게 사고하나요? '쟤는 머즐이 기니까 스피츠', '쟤는 작아보이니까 포메' 이런 생각을 의식적으로 하지는 않고 그냥 '포메네' '스피츠네' 할겁니다.

 

딥러닝의 경우에는 주로 영상인식을 위해 자주 사용되는 CNN(Convolutional Neural Networks 합성곱 신경망) 의 경우 문자 그대로 포메라니안 사진 100장, 스피츠 사진 100장 주고 외우라고 시킵니다. 컴퓨터는 알아서 '이렇게 생긴 애는 포메' '이렇게 생긴 애는 스피츠' 하면서 배우고 다른 사진을 던져주면 바로 답을 냅니다.

 

최근에 그림 인공지능 관련해서 이슈가 많았죠?

 

육손이 아니라 칠손이라던지 연체동물 손도 섞인거 같네요.

 

재미있게도 그림 인공지능은 손을 잘 못그린다 합니다. (글래스고 예대 나온 동료 피셜) 위 사진처럼 기괴하게 나오는게 태반이라 육손이 나온다면 잘 그린거랍니다.

 

육손의 예시. 이 애니는 그림 인공지능보다 한창전 2000년도 중후반에 나왔습니다.

생성형 AI는 딥러닝으로 짜지는데, 생성형 AI가 학습할 때에 얼굴이나 머리칼 같이 척봐도 특징이 두드러지는 건 잘 학습합니다. 얼굴은 눈 둘, 입 하나, 귀 둘, 코 하나 등 특징이 뚜렸하고, 머리칼은 '미소녀 캐릭터는 머리칼을 봐야 구분이 가능하다' 할 정도로 인물을 결정지을 수 있는 특징이니까요. 게다가 만화나 삽화 등에서 인물은 얼굴이 자주 강조되기도 합니다.

 

미국 만화는 4손이 자주 나옵니다. 이유는 잘 모르겠어요.

하지만 손은 그렇지 않습니다. 그림에서 짝대기 몇개 그리면 손 이라고 학습해버린데다가, 미국 만화에서 자주 나오는 4손까지 학습할 가능성도 있기 때문에 학습 난이도가 좀 더 높아집니다. 얼굴에 대비해서 손은 특징이 덜 두드러지는 부위기도 하고요. 위의 만화 사진 두개만 봐도 얼굴은 누가 누구인지 확 티가 나는데 손은 그렇지 않잖아요.

 

이게 다 딥러닝이란 알고리즘의 특징에서 기인한 일입니다. 사진 던져주며 얼굴, 손, 옷, 치마, 셔츠, 하다보니 상대적으로 덜 부각되는 부위인 손은 작화붕괴가 자주 일어나는 거죠.

 

뭐 이 글을 쓰는 시점에서 그림 인공지능들은 육손 문제를 잘 해결했을 가능성도 있습니다.