AI에게 배우는 『73년생 한동훈』 비평
지난번 글(링크)에서는 한 모 씨 욕을 여러 가지 말투로 대량생산 하는 법을 알아보았다. 이번에는 야매로 하는 초간단 텍스트 분석을 해보겠다. 하지만 그걸 하자고 한 모 씨에 대한 글을 읽으며 귀중한 내 돈과 시간 그리고 삼림자원을 낭비할 수는 없는 일. 마침 딴지 기사로 이미 『73년생 한동훈』이란 책에 대한 리뷰(링크)가 있으니 천만다행이다.
'73년생 한동훈'의 저자 심규진 씨
본격적으로 시작하기 전에, 복습부터 해보자.
Q
다음 예시를 참고해서,
책이 너무 형편 없어서 책 만든 노력이 아깝다는 표현을 10가지 만들어줘.
<예시>
이딴 책을 사느라 귀중한 산림자원을 낭비할 수는 없다.
책 만드느라 들어간 탄소 배출이 아깝다.
A
이 책을 만드느라 희생된 나무들이 불쌍해서 눈물이 난다.
이 책을 인쇄하는 데 소모된 잉크로 명화를 그릴 수 있었을 텐데, 안타깝다....
괜찮은 편이지만 조금 심심하다.
얼마 전 공개된 클로드(Claude) 3를 이용해 봤다.
존경하는 판사님,
이 글은 밥 먹고 있을 때
인공지능이 제멋대로 쓴 글입니다.
저와는 전혀 무관함을 밝힙니다...
인용 문구만 골라내는 것도 문제 없는 챗GPT
『73년생 한동훈』 리뷰 기사에서 책 내용을 그대로 인용한 부분만 뽑아서 이것저것 분석을 해보고 싶다. 해당 문장을 하나씩 복사-붙여넣기 해도 되겠지만, 훨씬 방대한 텍스트라고 상상하고 해보자.
일단 챗GPT에게 텍스트 일부를 긁어다 붙여넣고 어떻게 따옴표 안의 문장만 추출할 건지 물어본다.
정규표현식이 뭔지는 모르겠지만, 이렇게 하면 된단다. 위의 코드를 이용해서 구글 코랩에서 파이썬을 돌리면 된다. 지금은 따옴표 안의 문장만 뽑는 간단한 예시지만, 훨씬 더 복잡한 패턴도 추출할 수 있다. 다른 도구(라이브러리)를 쓰면 html 등 훨씬 더 복잡한 내용에서 추출(파싱)도 가능하다.
겁 먹을 필요 전혀 없다. 쉽다
넹!?? 파이썬이 뭐 어쩌구 어째요?
긴장할 필요 없다.
챗GPT 유료 사용자라면, 고민하지 말고 그냥 텍스트를 통째로 올리고 '방금 네가 설명한 대로 추출해 달라'고 하면 된다. 챗GPT의 가장 강력한 기능 중의 하나가 창 내에서 직접 코드를 짜고 실행한다는 점이다. 여러 가지 삽질을 하다가 결국 해내는 모습이 흐뭇하지 않은가?
무료 사용자라면, 그냥 텍스트를 통째로 긁어다 프롬프트 창에 붙여다 놓고 지시하면 된다. 제미나이, 챗GPT 뭐든 상관없지만, 클로드(Claude)를 추천한다. 빠르고 가장 긴 문장을 처리할 수 있기 때문이다.
다음과 같이 표로 만들어 주는 걸 볼 수 있다. 텍스트가 너무 길어 한 창에 다 안 들어간다면, 몇 번 나눠서 넣어도 된다.
『73년생 한동훈』에 대한 AI(클로드)의 평가
따옴표 안의 문장만 깔끔하게 분리되었다. 그걸 통째로 복사-붙여넣기 해서 창에다 때려놓고 다짜고짜 물어보자.
Q
다음 텍스트에 대해 평가해줘.
매우 정확한 평가를 하고 있다. 이번에는 텍스트들을 분류해 보자.
매우 대충 지시했지만, 알아서 잘 분류하고 있다. 위 분류에 따라서, 표로 만들 수도 있다.
감성분석까지 해주는 AI(클로드)
내친 김에 감성분석도 실시해 본다. 글에 사용된 감성이 긍정/부정 어느쪽인지 살펴보는 것인데, 자연어 처리 분야에서 중요한 주제 중 하나이다.
예전이라면 파이썬이나 R은 기본으로 해야 하고, 제대로 하기는 기술적으로 매우 어려웠지만 이제는 누구나 맛볼수 있다.
대충 어떤 건지는 알겠는데 구체적인 방법을 모른다. 일단 감성분석 관련 논문을 적당한 걸 찾아서 업로드하고 물어보자.
저런 빅 데이터는 물론 채팅창에서 처리할 수 없다. 하지만 길지 않은 텍스트라면 간단히 맛볼 수 있다. 프롬프트 길게 하기 귀찮다. 다짜고짜 다음과 같이 물어보면서 텍스트를 때려 넣자.
Q
다음 텍스트에 대해서 위 방법론을 적용해서 감성분석을 해줘.
(텍스트 복붙)
음.. 아무래도 'KNU 한국어 감성사전'을 사용했다는 건 구라 같지만, 아무튼 대략적으로 긍정/부정 단어를 매기고 감성 지수를 산출했다. 원래는 행별로 긍정/부정 어느쪽인지 파악하는 게 목적이니 한 번 더 물어본다.
맛보기로 한 것이라. 엄밀한 분석은 아니다.
AI(클로드)로 할 수 있는 것
지금까지 다룬 건, 클로드의 채팅창으로 할 수 있는 빙산의 일각이다. 지금은 기사 하나에 대해서 텍스트 분석을 했을 뿐이다. 하지만 비슷한 방법을 책 몇 권, 보고서/논문 수십 개 대상으로 적용할 수 있다. 코딩을 할 수 있다면 이걸 반자동으로 할 수도 있다. 즉 자료조사 및 팩트체크, 요약/번역, 텍스트 분석까지 한 방에 끝낼 수 있다.
이미 조사 및 팩트체크는 퍼플렉시티로하고, 요약은 클로드로, 데이터분석은 챗GPT로 여러 개의 AI 툴을 오가며 작업하는 건 대중화되었다. 아이디어 수집, 자료조사, 창작, 번역, 윤문, 보고서 작성, 데이터 입력/전처리를 말 몇 마디로 처리하는 시대가 이미 와 있다.
<계속>
검색어 제한 안내
입력하신 검색어는 검색이 금지된 단어입니다.
딴지 내 게시판은 아래 법령 및 내부 규정에 따라 검색기능을 제한하고 있어 양해 부탁드립니다.
1. 전기통신사업법 제 22조의 5제1항에따라 불법촬영물 등을 기재(유통)시 삭제, 접속차단 등 유통 방지에 필요한 조치가 취해집니다.
2. 성폭력처벌법 제14조, 청소년성처벌법 제11조에 따라 불법촬영물 등을 기재(유통)시 형사 처벌을 받을 수 있습니다.
3. 『아동·청소년의 성보호에 관한 법률』 제11조에 따라 아동·청소년이용 음란물을 제작·배포 소지한 자는 법적인 처벌을 받으실 수 있습니다.
4. 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 시행령에 따라 청소년 보호 조치를 취합니다.
5. 저작권법 제103조에 따라 권리주장자의 요구가 있을 시 복제·전송의 중단 조치가 취해집니다.
6. 내부 규정에 따라 제한 조치를 취합니다.