그 높은 평가, 정말 믿어도 될까? 가짜 리뷰를 간파하는 새로운 훈련법

그 높은 평가, 정말 믿어도 될까? 가짜 리뷰를 간파하는 새로운 훈련법

별 5개의 이면을 꿰뚫어 볼 수 있는가 - 가짜 리뷰 시대에 필요한 '소비자의 해독 능력'

인터넷 쇼핑몰에서 상품을 선택할 때, 우리는 무엇을 보고 있을까? 가격, 사진, 배송일, 브랜드명. 그리고 많은 경우, 마지막 한 방이 되는 것이 리뷰다. 별의 수가 많고 긍정적인 댓글이 줄지어 있으면 "사도 괜찮을 것 같다"고 느낀다. 반대로 낮은 평가가 두드러지면, 아무리 상품 사진이 매력적이어도 구매를 망설이게 된다.

하지만 그 별은 정말 믿을 수 있는 것일까?

온라인 리뷰는 현대의 소비 행동에서 '신뢰의 인프라'가 되었다. 알지 못하는 누군가의 체험담이 자신의 쇼핑을 좌우한다. 그곳에는 집단 지성의 힘이 있는 한편, 의도적으로 구매 판단을 조작하려는 가짜 리뷰 문제도 확산되고 있다.

네덜란드 트벤테 대학에서 박사 연구를 수행한 Michelle Walther 씨는 이 문제에 대해 흥미로운 각도에서 접근했다. 가짜 리뷰를 AI로 자동 검출하는 연구는 증가하고 있다. 그러나 Walther 씨가 주목한 것은 리뷰를 읽는 '소비자 자신'의 판단 프로세스다. 사람은 리뷰를 어떻게 읽고, 어떤 단서를 신뢰하며, 어느 단계에서 "이 리뷰는 참고하지 않는다"고 결정하는가. 그 메커니즘을 밝히고, 더 나아가 훈련을 통해 가짜 리뷰를 꿰뚫어 보는 능력을 높일 수 있는지를 검증했다.


소비자는 '가짜를 찾기 위해' 리뷰를 읽고 있지 않다

이 연구의 중요한 포인트는 소비자가 온라인 리뷰를 읽을 때, 반드시 '가짜 리뷰를 꿰뚫어 보려는' 것은 아니라는 점이다. 많은 사람에게 리뷰를 읽는 목적은 더 실용적이다.

이 상품은 나에게 맞는가. 사이즈는 어떤가. 설명문에 쓰여 있지 않은 결점은 없는가. 실제로 사용한 사람은 만족하고 있는가.

즉, 소비자가 먼저 찾고 있는 것은 '유용한 상품 정보'다. 가짜 리뷰인지 아닌지의 판정은 쇼핑의 중심 목적이 아니라, 어디까지나 판단의 도중에 생기는 부차적인 작업이 되기 쉽다.

여기에 가짜 리뷰의 까다로움이 있다. 소비자가 경계 모드에 들어가지 않은 상태에서, 자연스러운 체험담처럼 쓰인 리뷰가 눈에 들어온다. 별의 수가 높고, 문장도 그럴듯하며, 작성자 이름이나 프로필 사진까지 갖춰져 있으면, 읽는 이는 깊이 의심하지 않고 받아들여 버린다. 가짜 리뷰는 바로 그 '일상적인 읽기 방식'에 파고든다.


CREM 모델이란 무엇인가

Walther 씨는 문헌 리뷰, 관찰, 사고 발화법 등을 결합하여 소비자가 리뷰를 평가하는 과정을 정리했다. 그곳에서 탄생한 것이 'Consumer Review Evaluation Model', 줄여서 CREM 모델이다.

CREM 모델은 소비자가 리뷰를 한꺼번에 신뢰하는 것이 아니라, 단계적으로 판단하고 있음을 보여준다. 대략적으로 말하면, 소비자는 먼저 리뷰의 관련성을 본다. 자신이 알고 싶은 상품 정보에 관련되어 있는지, 구매를 검토하고 있는 용도에 맞는지, 구체적인 사용 장면이 쓰여 있는지를 확인한다.

다음으로, 작성자의 신뢰성을 평가한다. 실제로 상품을 사용한 사람으로 보이는지, 작성 이력이나 프로필에 부자연스러움은 없는지, 리뷰 내용과 평가 점수에 어긋남은 없는지 등의 점이 단서가 된다.

마지막으로, 리뷰 본문 자체의 신빙성을 본다. 내용이 구체적인지, 과도하게 과장되어 있지 않은지, 같은 표현이 나란히 있지 않은지, 감정 표현과 별의 수가 자연스럽게 일치하는지. 이러한 여러 요소를 통해 소비자는 그 리뷰를 구매 판단에 포함할지를 결정한다.

흥미로운 것은 이 프로세스가 반드시 전문가처럼 엄밀한 검증은 아니라는 점이다. 많은 소비자는 제한된 시간 속에서 직감과 경험에 의존하여 리뷰를 읽는다. 따라서 가짜 리뷰의 검출은 '지식'뿐만 아니라 '읽는 습관'에도 좌우된다.


훈련하면 가짜 리뷰를 꿰뚫어 보는 능력은 높아진다

Walther 씨의 연구가 보여준 또 하나의 중요한 점은 소비자의 가짜 리뷰 검출 능력은 훈련에 의해 개선될 수 있다는 것이다.

CREM 모델에 기반한 트레이닝에서는 소비자가 리뷰를 볼 때의 시점을 정리하고, 어떤 단서에 주의해야 할지를 배운다. 예를 들어, 단순히 별의 수를 보는 것이 아니라, 본문의 구체성이나 작성자의 신뢰성, 리뷰의 내용과 평가 점수의 일관성을 확인한다. 극단적으로 긍정적이거나 부정적인 표현, 상품의 특징에 언급하지 않는 추상적인 칭찬, 여러 리뷰에 공통되는 부자연스러운 표현 등도 경계해야 할 신호가 될 수 있다.

연구에서는 이러한 훈련을 받은 참가자가 가짜 리뷰를 식별하는 능력을 유의미하게 높였다고 한다. 이는 가짜 리뷰 대책을 플랫폼에만 맡기는 것이 아니라, 소비자 교육으로서도 추진될 가능성을 보여준다.

물론 소비자에게 모든 책임을 지우는 것은 옳지 않다. 가짜 리뷰를 게시하게 하는 사업자, 리뷰를 사고파는 업자, 대책이 불충분한 플랫폼에는 각각 명확한 책임이 있다. 그러나 현실적으로 가짜 리뷰가 완전히 사라질 때까지는 시간이 걸린다. 그동안 소비자 자신이 '리뷰를 읽는 힘'을 갖추는 것은 방어책의 하나가 된다.


AI 검출만으로는 부족한 이유

가짜 리뷰 대책에서는 AI에 의한 자동 검출도 중요한 테마가 되고 있다. 관련 연구에서는 리뷰 본문의 언어적 특징에 더해, 작성 행동, 별 평가와의 일관성, 문장의 길이 등을 결합하여 높은 정확도로 부정 리뷰를 판정하는 모델도 보고되고 있다.

그러나 AI 검출에는 한계도 있다. 가짜 리뷰를 쓰는 측도 진화하기 때문이다. 생성 AI를 사용하면 이전보다 자연스러운 문장을 대량으로 만들 수 있다. 단순한 키워드나 부자연스러운 일본어, 비슷한 문체만을 보고 있으면, 교묘한 가짜 리뷰를 놓칠 가능성이 있다.

더욱이 리뷰의 진위는 문장만으로 결정되지 않을 수 있다. 실제로 상품을 사지 않았더라도 그럴듯한 체험담을 쓸 수 있다. 반대로 진짜 리뷰라도 짧고 추상적인 것이 있다. AI가 의심스럽다고 판정한 리뷰가 반드시 가짜는 아니며, AI가 통과시킨 리뷰가 반드시 진짜도 아니다.

그렇기 때문에 플랫폼에 의한 검출, 법규제, 사업자의 투명성, 소비자 교육을 결합할 필요가 있다. Walther 씨의 연구는 그중에서도 '읽는 쪽의 인지 프로세스'에 초점을 맞춘 점에서 가치가 있다.


SNS 상의 반응 - '엄벌을 요구하는 목소리'와 'AI에 대한 기대'

이번 Phys.org 기사 자체에 대해서는 공개 직후라는 점도 있어, 확인할 수 있는 범위에서 대규모 SNS 논의는 아직 제한적이었다. Phys.org 상에서는 공유 수는 소수에 그치고, 댓글도 눈에 띄지 않는다. 하지만 가짜 리뷰 문제 전체에 대한 SNS나 비즈니스계 커뮤니티의 반응을 보면, 관심은 상당히 높다.

관련된 LinkedIn 게시물에서는 가짜 리뷰를 꿰뚫어 보는 AI 모델의 뉴스에 대해, 언어 분석뿐만 아니라 작성 행동 등의 신호를 결합하는 방법이 소개되었다. 반응 수는 크지 않지만, 논의의 방향성으로는 'AI로 검출할 수 있다면 환영'이라는 기대와 '가짜 리뷰 측도 AI를 사용해 교묘화할 것'이라는 경계가 동시에 존재하고 있다.

또한 리뷰 조사를 다루는 업계 게시물에서는 가짜 리뷰를 한 기업에 대해 처벌을 요구하는 소비자의 목소리가 강하다는 것이 나타나고 있다. 특히 리뷰 사이트에서의 배제, 검색 결과에서의 제외, 벌금, 경우에 따라서는 형사 처벌까지 요구하는 의견이 소개되고 있어, 소비자의 불신감이 상당히 깊어지고 있음을 엿볼 수 있다.

SNS적인 분위기를 요약하면, 가짜 리뷰는 이제 '조금 부풀린 광고'로는 끝나지 않는다. 소비자의 시간과 돈을 빼앗고, 성실하게 장사하는 사업자를 불리하게 하며, 리뷰라는 시스템 자체를 파괴하는 행위로 여겨지고 있다.

한편으로 소비자 측에도 피로가 있다. '어느 리뷰도 의심스럽게 보인다', '별 5도 별 1도 믿을 수 없다', '결국 공식 정보와 반품 조건을 볼 수밖에 없다'는 감각은 많은 사람이 공유하기 쉬운 것이다. 리뷰가 많아질수록 신뢰할 수 있는 정보를 선택하는 부담도 증가한다. 가짜 리뷰 문제는 정보 과다의 시대에 있어서 '신뢰 피로'의 일부이기도 하다.


기업에게도 가짜 리뷰는 리스크가 된다

가짜 리뷰는 소비자만의 문제가 아니다. 기업에게도 큰 리스크다.

단기적으로는 가짜의 높은 평가 리뷰로 인해 매출이 증가할 수 있다. 그러나 부정이 발각되면 브랜드에 대한 신뢰는 크게 손상된다. 더욱이 미국에서는 FTC가 가짜 리뷰나 허위 추천을 금지하는 규칙을 내놓고, 영국에서도 경쟁·시장청이 Google 등에 대해 가짜 리뷰 대책 강화를 요구하고 있다. 법규제의 흐름은 분명히 엄격해지고 있다.

기업이 주의해야 할 것은 자사에서 가짜 리뷰를 쓰지 않는 것만이 아니다. 인센티브가 있는 리뷰의 취급, 직원이나 관계자에 의한 리뷰, 부정적인 리뷰의 부당한 삭제, 리뷰 사이트를 가장한 자사 광고 등도 문제가 될 수 있다. 리뷰는 광고와 입소문의 중간에 있는 것처럼 보이지만, 소비자에게 주는 영향이 큰 만큼 투명성과 공정성이 요구된다.

성실한 기업에게는 가짜 리뷰 대책은 부담이면서 동시에 차별화의 기회이기도 하다. 구매자 인증, 리뷰 작성 정책의 명시, 낮은 평가에 대한 성실한 답변, 부자연스러운 리뷰의 신고, 상품 개선에의 반영. 이러한 꾸준한 대응은 단기적인 별의 수 이상으로 장기적인 신뢰를 만든다.


소비자가 오늘부터 할 수 있는 리뷰 읽는 방법

그렇다면 소비자는 리뷰를 볼 때 무엇을 의식해야 할까? CREM 모델의 생각을 일상의 쇼핑에 적용한다면, 먼저 '그 리뷰가 내가 알고 싶은 정보에 답하고 있는가'를 보는 것이 좋다. 단순한 '최고입니다', '추천합니다'보다도 사용 상황, 기간, 비교 대상, 결점이 쓰여 있는 리뷰가 참고하기 쉽다.

다음으로 작성자의 신뢰성을 본다. 구매자 인증이 있는지, 작성 이력이 극단적으로 치우치지 않았는지, 같은 날 비슷한 높은 평가를 연달아 올리지 않았는지. 프로필이 완벽하다고 해서 진짜는 아니지만, 부자연스러운 패턴은 경계 자료가 된다.

더 나아가 리뷰 본문의 균형을 본다. 실제 사용자는 좋은 점뿐만 아니라 작은 불만도 쓰는 경우가 많다. 반대로 광고문처럼 미점만을 나열한 리뷰나 상품의 구체적인 특징에 언급하지 않는 절찬은 주의하고 싶다. 별 평가와 본문의 온도 차도 단서가 된다. 별 5인데 내용이 너무 얇거나, 별 1인데 구체적인 문제가 쓰여 있지 않은 경우는 그 리뷰만으로 판단하지 않는 것이 좋다.

마지막으로 하나의 리뷰가 아니라 전체의 분포를 보는 것이 중요하다. 높은 평가와 낮은 평가를 모두 읽고, 공통적으로 나오는 지적을 찾는다. 여러 사람이 같은 결점을 구체적으로 언급하고 있다면, 그것은 중요한 정보일지도 모른다. 반대로 같은 표현의 높은 평가가 단기간에 집중되어 있다면, 신중히 보는 것이 좋다.


리뷰를 '믿는 것'에서 '해독하는 것'으로

온라인 리뷰는 편리하다. 실제로 많은 사람에게 리뷰가 없다면 인터넷 쇼핑은 더 불안한 것이 된다. 문제는 리뷰를 무조건 믿는 것도 아니고, 모든 것을 의심하는 것도 아니다. 필요한 것은 리뷰를 정보로서 해독하는 자세다.

Walther 씨의 연구는 소비자가 리뷰를 어떻게 평가하고 있는지를 시각화하고, 그 판단력을 훈련에 의해 높일 수 있는 가능성을 보여주었다. 이는 가짜 리뷰 대책을 단순한 기술 문제로서가 아니라, 소비자 교육, 플랫폼 설계, 기업 윤리, 법규제를 포함한 사회적 과제로서 바라보는 시각을 제공한다.

별의 수는 앞으로도 우리의 쇼핑에 영향을 미칠 것이다. 그렇기 때문에 그 별이 어떻게 만들어졌고, 누가 이야기하며, 어디까지 신뢰할 수 있는지를 가려내는 힘이 필요하다.

리뷰 사회의 다음 과제는 리뷰를 늘리는 것이 아니다. 신뢰할 수 있는 리뷰를 찾고, 의심스러운 리뷰에 휘둘리지 않는 환경을 만드는 것이다. 그리고 그 첫걸음은 우리 각자가 별의 수의 이면을 조금 더 주의 깊게 보는 것에서 시작된다.


출처 URL

  • Phys.org. 트벤테 대학 Michelle Walther 씨의 박사 연구, CREM 모델, 훈련 프로그램에 의한 가짜 리뷰 검출 능력 향상에 대한 개요.
    https://phys.org/news/2026-05-consumers-fake-method.html
  • University of Twente에 의한 동일 연구의 소개 기사. 소비자가 리뷰를 읽을 때, 가짜 리뷰 검출을 주목적으로 하지 않는 것, CREM