최신 기사 추천 기사 연재 기사 마빡 리스트

 

AI에게 배우는 『73년생 한동훈』 비평

 

지난번 글(링크)에서는 한 모 씨 욕을 여러 가지 말투로 대량생산 하는 법을 알아보았다. 이번에는 야매로 하는 초간단 텍스트 분석을 해보겠다. 하지만 그걸 하자고 한 모 씨에 대한 글을 읽으며 귀중한 내 돈과 시간 그리고 삼림자원을 낭비할 수는 없는 일. 마침 딴지 기사로 이미 『73년생 한동훈』이란 책에 대한 리뷰(링크)가 있으니 천만다행이다.

 

책표지.jpg

 

채널A 심규진.png

'73년생 한동훈'의 저자 심규진 씨

 

본격적으로 시작하기 전에, 복습부터 해보자.

 

Q

다음 예시를 참고해서,

책이 너무 형편 없어서 책 만든 노력이 아깝다는 표현을 10가지 만들어줘.

 

<예시>

이딴 책을 사느라 귀중한 산림자원을 낭비할 수는 없다.

책 만드느라 들어간 탄소 배출이 아깝다.

 

A

이 책을 만드느라 희생된 나무들이 불쌍해서 눈물이 난다.

이 책을 인쇄하는 데 소모된 잉크로 명화를 그릴 수 있었을 텐데, 안타깝다....

 

괜찮은 편이지만 조금 심심하다.

 

얼마 전 공개된 클로드(Claude) 3를 이용해 봤다.

 

스크린샷 2024-03-10 오전 9.09.59.png

존경하는 판사님,

이 글은  밥 먹고 있을 때

인공지능이 제멋대로 쓴 글입니다.

저와는 전혀 무관함을 밝힙니다...

 

인용 문구만 골라내는 것도 문제 없는 챗GPT

 

『73년생 한동훈』 리뷰 기사에서 책 내용을 그대로 인용한 부분만 뽑아서 이것저것 분석을 해보고 싶다. 해당 문장을 하나씩 복사-붙여넣기 해도 되겠지만, 훨씬 방대한 텍스트라고 상상하고 해보자.

 

일단 챗GPT에게 텍스트 일부를 긁어다 붙여넣고 어떻게 따옴표 안의 문장만 추출할 건지 물어본다.

 

캡처2.PNG

 

정규표현식이 뭔지는 모르겠지만, 이렇게 하면 된단다. 위의 코드를 이용해서 구글 코랩에서 파이썬을 돌리면 된다. 지금은 따옴표 안의 문장만 뽑는 간단한 예시지만, 훨씬 더 복잡한 패턴도 추출할 수 있다. 다른 도구(라이브러리)를 쓰면 html 등 훨씬 더 복잡한 내용에서 추출(파싱)도 가능하다.  

 

겁 먹을 필요 전혀 없다. 쉽다

 

넹!?? 파이썬이 뭐 어쩌구 어째요?

 

긴장할 필요 없다.

 

챗GPT 유료 사용자라면, 고민하지 말고 그냥 텍스트를 통째로 올리고 '방금 네가 설명한 대로 추출해 달라'고 하면 된다. 챗GPT의 가장 강력한 기능 중의 하나가 창 내에서 직접 코드를 짜고 실행한다는 점이다. 여러 가지 삽질을 하다가 결국 해내는 모습이 흐뭇하지 않은가?

 

캡처3.PNG

 

무료 사용자라면, 그냥 텍스트를 통째로 긁어다 프롬프트 창에 붙여다 놓고 지시하면 된다. 제미나이, 챗GPT 뭐든 상관없지만, 클로드(Claude)를 추천한다. 빠르고 가장 긴 문장을 처리할 수 있기 때문이다.


스크린샷 2024-03-10 오전 10.21.57.png

 

다음과 같이 표로 만들어 주는 걸 볼 수 있다. 텍스트가 너무 길어 한 창에 다 안 들어간다면, 몇 번 나눠서 넣어도 된다.

 

스크린샷 2024-03-10 오전 10.22.44.png

 

『73년생 한동훈』에 대한 AI(클로드)의 평가

 

따옴표 안의 문장만 깔끔하게 분리되었다. 그걸 통째로 복사-붙여넣기 해서 창에다 때려놓고 다짜고짜 물어보자.

 

Q

다음 텍스트에 대해 평가해줘.

 

캡처5.PNG

 

매우 정확한 평가를 하고 있다. 이번에는 텍스트들을 분류해 보자.

 

캡처6.PNG

 

매우 대충 지시했지만, 알아서 잘 분류하고 있다. 위 분류에 따라서, 표로 만들 수도 있다. 

 

캡처7.PNG

 

감성분석까지 해주는 AI(클로드)

 

내친 김에 감성분석도 실시해 본다. 글에 사용된 감성이 긍정/부정 어느쪽인지 살펴보는 것인데, 자연어 처리 분야에서 중요한 주제 중 하나이다.

 

예전이라면 파이썬이나 R은 기본으로 해야 하고, 제대로 하기는 기술적으로 매우 어려웠지만 이제는 누구나 맛볼수 있다. 

대충 어떤 건지는 알겠는데 구체적인 방법을 모른다. 일단 감성분석 관련 논문을 적당한 걸 찾아서 업로드하고 물어보자.

 

캡처.PNG

 

저런 빅 데이터는 물론 채팅창에서 처리할 수 없다. 하지만 길지 않은 텍스트라면 간단히 맛볼 수 있다. 프롬프트 길게 하기 귀찮다. 다짜고짜 다음과 같이 물어보면서 텍스트를 때려 넣자. 

 

Q

다음 텍스트에 대해서 위 방법론을 적용해서 감성분석을 해줘.
(텍스트 복붙)

 

캡처2.PNG

 

음.. 아무래도  'KNU 한국어 감성사전'을 사용했다는 건 구라 같지만, 아무튼 대략적으로 긍정/부정 단어를 매기고 감성 지수를 산출했다. 원래는 행별로 긍정/부정 어느쪽인지 파악하는 게 목적이니 한 번 더 물어본다.

 

캡처3.PNG

 

맛보기로 한 것이라. 엄밀한 분석은 아니다. 

 

AI(클로드)로 할 수 있는 것 

 

지금까지 다룬 건, 클로드의 채팅창으로 할 수 있는 빙산의 일각이다. 지금은 기사 하나에 대해서 텍스트 분석을 했을 뿐이다. 하지만 비슷한 방법을 책 몇 권, 보고서/논문 수십 개 대상으로 적용할 수 있다. 코딩을 할 수 있다면 이걸 반자동으로 할 수도 있다. 즉 자료조사 및 팩트체크, 요약/번역, 텍스트 분석까지 한 방에 끝낼 수 있다. 

 

이미 조사 및 팩트체크는 퍼플렉시티로하고, 요약은 클로드로, 데이터분석은 챗GPT로 여러 개의 AI 툴을 오가며 작업하는 건 대중화되었다. 아이디어 수집, 자료조사, 창작, 번역, 윤문, 보고서 작성, 데이터 입력/전처리를 말 몇 마디로 처리하는 시대가 이미 와 있다. 

 

<계속>