[매경의 창] 버티컬 AI 시대가 다가온다

United States News News

[매경의 창] 버티컬 AI 시대가 다가온다
United States Latest News,United States Headlines
  • 📰 maekyungsns
  • ⏱ Reading Time:
  • 79 sec. here
  • 3 min. at publisher
  • 📊 Quality Score:
  • News: 35%
  • Publisher: 51%

수학·알고리즘적 사고능력서제미나이-DT·GPT-T 뛰어나수개월만에 박사급 수준 답안이들 써서 일하는 버티컬 AI2년내 곳곳서 역할 커질 것

2년내 곳곳서 역할 커질 것 전공이 알고리즘인 필자는 대규모언어모델을 평가할 때 알고리즘적 사고능력을 본다. 문제가 어려울수록 관점의 확립이 중요해진다. LLM은 자신이 구축한 관계의 네트워크 공간에서 문제를 암묵적으로 포지셔닝한다. LLM 벤치마크 풍년이다. 벤치마크 테스트가 반복되면 문제들이 알려지게 되고, LLM 입장에서 해당 벤치마크 스타일로 훈련할 수 있는 여지가 생긴다.

LLM에 따라서는 자신에게 유리한 벤치마크를 선택해 발표하기도 하고, 만만한 LLM들을 비교 대상으로 고르기도 한다. 벤치마크는 많지만 알고리즘적 사고를 충분히 테스트하는 것을 아직 보지 못했다. 필자는 직접 벤치마크를 만들었다. 필자가 강의하는 컴퓨터 알고리즘 과목의 3년 치 시험 문제를 LLM 테스트에 맞게 변형했다. 우리 학생들이 오픈북으로 서술형 답안을 내는 문제들이고 평균 점수는 대개 50~60점이다. 이 문제들은 수학적·알고리즘적 사고를 통해 인간 사고의 깊은 부분을 건드린다. 그래서 필자는 이 테스트에서 차이가 나면 논리적 사고를 요구하는 다른 능력에서도 비슷한 차이가 날 것이라 짐작한다. 현재 코딩 부분에서 잘한다는 클로드는 알고리즘 벤치마크에서 테스트한 LLM 8개 중 거의 꼴찌 수준이다. 코딩은 알고리즘과 밀접한 관련이 있다. 난도 높은 고급 코딩의 경우 이미 존재하는 코드가 없으면 최고 수준인 제미나이나 GPT-5에 견줄 수 없을 것이다. 지난 5월에는 제미나이2.5-Pro가 독보적 챔피언이었다. 8월에는 GPT-5 Thinking이 독보적 챔피언이 됐다. 이어 제미나이2.5-Pro-DeepThink가 다시 챔피언을 탈환했다. 제미나이-DT가 GPT-T보다 먼저 공개됐으나, 제미나이 울트라 멤버들만 쓸 수 있어 테스트 순서가 바뀌었다. 필자의 알고리즘 과목은 대개 100명 안팎의 학생이 수강한다. 5월에 제미나이2.5-Pro가 1등일 때는 우리 학생들 중 9등 정도로 A+ 수준이었다. 8월에 GPT-T가 1등일 때는 2~3등으로 A+였다. 이어 제미나이-DT가 1등을 탈환하면서 우리 학생들 중에서도 1등짜리 A+가 되었다. 이제 제미나이-DT 앞에 아무도 없다. 최고 수준의 박사에 모자람이 없다. 100점 만점에 제미나이-DT, GPT-T, 제미나이2.5-Pro의 점수는 각각 93.8, 90.4, 75.5다. 제미나이-DT가 GPT-T보다 낫긴 하지만 울트라 회원에게만 서비스되고 응답 속도도 매우 느리다. GPT-T는 일반 회원들도 쓸 수 있다. 필자처럼 무겁게 LLM의 응용프로그래밍인터페이스를 사용하는 입장에서 최선의 선택은 GPT-T다. 프로젝트가 잘 진행되지 않는 경우들을 보면 관점의 빈곤이 큰 영향을 미친다. 고난도 프로젝트는 필연적으로 후반부에 극복해야 할 난관이 기다리는데, 이럴 때 스스로 생각할 수 있는 힘은 천성, 습관, 관점에서 나온다. 그래서 손대면 항상 좋은 결과가 나오는 사람이 있고 손대는 것마다 후반부에서 좌초하는 사람이 있다. 마지막 5% 차이로 몸값이 10배 차이가 나도 아깝지 않다. LLM들도 어려운 문제에서 관점의 형성과 논리의 흐름을 끝까지 놓치지 않는 뒷심의 차이가 크다. 필자처럼 최적화 프로젝트에 LLM을 도구로 '사용'하는 입장에서는 국산이든 외산이든 최고 품질의 LLM 중 수행 시간과 비용이 합리적인 것을 쓰면 된다. 현재 필자의 선택은 GPT-T다. 최근 3년 인공지능 혁명의 주인공은 LLM이었다. 이제는 각 분야에서 LLM을 도구로 사용해서 가치 있는 일을 하는 버티컬 AI 시대가 본격적으로 시작되고 있다. 향후 2년이면 아주 크게 성공한 버티컬 AI들이 출현하기에 충분할 것이다.

We have summarized this news so that you can read it quickly. If you are interested in the news, you can read the full text here. Read more:

maekyungsns /  🏆 15. in KR

 

United States Latest News, United States Headlines

Similar News:You can also read news stories similar to this one that we have collected from other news sources.

한국 진출한 오픈AI, 국내 데이터센터 구축 검토한국 진출한 오픈AI, 국내 데이터센터 구축 검토생성형 인공지능(AI) 'GPT'를 개발한 미국의 AI업체 오픈에이아이(AI)가 국내 진출했다. 오픈AI는2022년 대화형 AI 서비스 '챗G
Read more »

한국 진출 본격 선언한 오픈AI…올트먼이 한국을 선택한 이유한국 진출 본격 선언한 오픈AI…올트먼이 한국을 선택한 이유‘오픈AI 코리아’ 공식 출범…한국 사업 본격 시동 제이슨 권 “한국은 AI 풀스택 갖춘 중요한 나라”
Read more »

마이크로소프트 AI 투자 소식에 비트코인 채굴주 일제히 랠리…데이터센터 AI 전환 기대감마이크로소프트 AI 투자 소식에 비트코인 채굴주 일제히 랠리…데이터센터 AI 전환 기대감네비우스 AI 인프라 잭팟 소식에 라이엇 13%·마라 5% 상승 마감 비트코인 횡보에도 채굴주 급등 채굴 난이도 지속 상승한 영향에 AI용으로 데이터센터 전환속도↑ 장비·전력·냉각 인프라 활용가능 클라우드社 채굴주 인수 사례도
Read more »

한국투자공사, 국내 기관투자자와 ‘AI 시대’ 투자 전략 점검한국투자공사, 국내 기관투자자와 ‘AI 시대’ 투자 전략 점검제51차 해외투자협의회 개최 글로벌 AI 투자 동향 공유
Read more »

[단독] “韓 AI 산업활동 수준, 美의 14% 불과…AI 전환 촉진 기금 조성해야”[단독] “韓 AI 산업활동 수준, 美의 14% 불과…AI 전환 촉진 기금 조성해야”김성원 국민의힘 의원실 입수 산업연 ‘산업 AI 확산 보고서’ 10년간 AI 누적 민간 투자 한국, 미국의 2.1%에 불과
Read more »

“AI 에이전트 혁신 돕는 파트너”···삼성SDS의 전략은“AI 에이전트 혁신 돕는 파트너”···삼성SDS의 전략은삼성SDS가 인프라부터 솔루션까지 전 영역을 아우르는 ‘인공지능(AI) 풀스택(Full Stack)’ 서비스로 기업들의 AI 에이전트 도입...
Read more »



Render Time: 2026-04-01 23:05:43