다부스트 / 셔터스톡

와 더불어 최근 해고와 신속한 재고용 오픈AI(OpenAI)의 샘 알트먼(Sam Altman)의 강연을 통해 인공지능(AI) 개발과 활용을 둘러싼 논의가 다시 한 번 주목받고 있다. 더욱 특이한 점은 언론 보도에서 두드러진 주제가 바로 수학을 수행하는 AI 시스템.

분명히 OpenAI의 드라마 중 일부는 회사의 새로운 제품 개발과 관련이 있었습니다. Q*라는 AI 알고리즘. 이 시스템은 상당한 발전을 이루었다고 평가되며, 그 두드러진 특징 중 하나는 수학적으로 추론할 수 있는 능력이었습니다.

그런데 AI의 기본은 수학이 아닌가? 컴퓨터와 계산기가 수학적 작업을 수행할 수 있는데 AI 시스템이 수학적 추론에 어떻게 문제를 일으킬 수 있습니까?

AI는 단일 개체가 아닙니다. 이는 인간의 직접적인 지시 없이 계산을 수행하기 위한 전략의 패치워크입니다. 앞으로 살펴보겠지만 일부 AI 시스템은 수학에 능숙합니다.

그러나 현재 가장 중요한 기술 중 하나인 ChatGPT와 같은 AI 챗봇의 기반이 되는 대규모 언어 모델(LLM)은 지금까지 수학적 추론을 모방하는 데 어려움을 겪었습니다. 이는 언어에 집중하도록 설계되었기 때문입니다.


내면의 구독 그래픽


회사의 새로운 Q* 알고리즘이 보이지 않는 수학적 문제를 해결할 수 있다면 그럴 수도 있습니다. 중요한 돌파구가 되다. 수학은 인간 추론의 고대 형태이다. 대규모 언어 모델(LLM) 지금까지 모방하려고 애썼습니다. LLM은 다음과 같은 시스템의 기반이 되는 기술입니다. OpenAI의 ChatGPT.

이 글을 쓰는 시점에서는 Q* 알고리즘과 그 기능에 대한 세부 사항이 제한되어 있지만 매우 흥미롭습니다. 따라서 Q*가 성공했다고 간주하기 전에 고려해야 할 다양한 세부 사항이 있습니다.

예를 들어, 수학은 모든 사람이 다양한 범위로 참여하는 과목이며, Q*가 능숙하게 다룰 수 있는 수학 수준은 여전히 ​​불분명합니다. 그러나 연구 수준의 수학을 발전시키기 위해 대체 형태의 AI를 사용하는 학술 연구가 발표되었습니다(내가 쓴 것 포함해서, Google DeepMind 연구원과 협력하여 수학자 팀이 작성한 것).

이러한 AI 시스템은 수학에 능숙하다고 설명할 수 있습니다. 그러나 Q*는 학계의 작업을 돕는 데 사용되는 것이 아니라 다른 목적으로 사용되는 것 같습니다.

그럼에도 불구하고, Q*가 최첨단 연구의 경계를 넓힐 수 없더라도, 미래 개발을 위한 감질나는 기회를 높일 수 있는 구축 방식에서 발견될 수 있는 중요성이 매우 높습니다.

점점 더 편안해짐

사회로서 우리는 미리 결정된 유형의 문제를 해결하는 데 전문가 AI가 사용되는 것에 점점 더 익숙해지고 있습니다. 예를 들어, 디지털 어시스턴트, 얼굴 인식온라인 추천 시스템 대부분의 사람들에게 친숙할 것입니다. 아직 파악하기 어려운 것은 소위입니다. "인공 일반 지능"(AGI) 인간과 맞먹는 폭넓은 추론 능력을 갖고 있다.

수학은 우리가 모든 학교 어린이에게 가르치고자 하는 기본 기술이며 AGI를 찾는 데 있어 근본적인 이정표가 될 것입니다. 그렇다면 수학적으로 유능한 AI 시스템이 사회에 또 어떻게 도움이 될까요?

수학적 사고방식은 코딩 및 엔지니어링과 같은 다양한 응용 프로그램과 관련이 있으므로 수학적 추론은 인간과 인공 지능 모두에게 중요한 양도 가능한 기술입니다. 한 가지 아이러니한 점은 AI가 근본적인 수준에서 수학을 기반으로 한다는 점입니다.

예를 들어, AI 알고리즘으로 구현되는 많은 기술은 궁극적으로 다음과 같은 수학적 영역으로 귀결됩니다. 행렬 대수학. 매트릭스는 단순히 숫자의 격자로, 디지털 이미지가 그 대표적인 예입니다. 각 픽셀은 숫자 데이터에 지나지 않습니다..

대규모 언어 모델도 본질적으로 수학적입니다. 엄청난 양의 텍스트 샘플을 기반으로 기계는 다음과 같은 단어의 확률을 학습할 수 있습니다. 사용자의 프롬프트(또는 질문)를 따를 가능성이 가장 높습니다. 챗봇으로. 사전 훈련된 LLM이 특정 주제를 전문적으로 다루기를 원한다면 수학 문헌이나 다른 학습 영역에 맞게 조정할 수 있습니다. LLM은 마치 수학을 이해하는 것처럼 읽는 텍스트를 생성할 수 있습니다.

불행하게도 그렇게 하면 허세에는 좋지만 세부적인 부분에는 나쁜 LLM이 생성됩니다. 문제는 수학적 진술이 정의에 따라 할당될 수 있다는 것입니다. 명확한 부울 값 (즉, 참 또는 거짓). 수학적 추론은 이전에 확립된 것으로부터 새로운 수학적 진술을 논리적으로 추론하는 것입니다.

악마의 옹호자

당연히 언어적 확률에 의존하는 수학적 추론에 대한 모든 접근 방식은 차선을 벗어나게 될 것입니다. 이를 해결하는 한 가지 방법은 공식 검증 시스템을 아키텍처(정확히 LLM이 구축되는 방식)에 통합하여 대규모 언어 모델의 도약 뒤에 있는 논리를 지속적으로 확인하는 것입니다.

이 작업이 수행되었다는 단서는 Q*라는 이름에 있을 수 있습니다. 1970년대에 개발된 알고리즘 연역적 추론을 돕기 위해. 또는 Q*는 올바른 결론을 테스트하고 보상함으로써 모델이 시간이 지남에 따라 개선될 수 있는 Q-학습을 나타낼 수 있습니다.

그러나 수학적으로 가능한 AI를 구축하는 데는 몇 가지 과제가 존재합니다. 예를 들어, 가장 흥미로운 수학 중 일부는 가능성이 매우 낮은 사건으로 구성됩니다. 작은 숫자를 바탕으로 패턴이 있다고 생각하지만, 사례를 충분히 확인하다 보면 의외로 무너지는 경우가 많다. 이 기능은 기계에 통합하기가 어렵습니다.

또 다른 도전은 놀랍게도 올 수 있습니다. 수학적 연구는 매우 창의적일 수 있습니다. 실무자는 새로운 개념을 창안하면서도 기존 원칙을 고수해야 하기 때문에 그래야 합니다. 고대 주제의 형식적 규칙.

기존 수학에서 패턴을 찾기 위해 훈련된 AI 방법론은 아마도 진정으로 새로운 수학을 창출할 수 없을 것입니다. 수학과 기술 사이의 파이프라인을 고려하면 이는 새로운 기술 혁명의 개념을 배제하는 것처럼 보입니다.

하지만 잠시 악마의 옹호자 역할을 맡아 AI가 실제로 새로운 수학을 창조할 수 있는지 상상해 봅시다. 이에 대한 이전 주장에는 결함이 있는데, 최고의 인간 수학자 역시 기존 수학에 대해서만 훈련을 받았다고 말할 수도 있습니다. 대규모 언어 모델은 이전에도 우리를 놀라게 했고 앞으로도 그럴 것입니다.대화

톰 올리버, 컴퓨터 과학 및 공학 강사, 웨스트 민스터 대학교

이 기사는에서 다시 게시됩니다. 대화 크리에이티브 커먼즈 라이센스하에 읽기 원래 기사.