@ 2 백만 개의 토 큰 컨 텍 스트 , 네 이 티브 다 중 모 드가 있으며 Chat G PT , Code x 및 브라우 저 기능을 하나의 슈퍼 앱 으로 결합 할 수 있다고 합니다 .진실 과 거짓 은 아직 확인 되지 않았지만 , 이 단 서 세 트는 동일한 문제를 지적 합니다 : 최 첨 단 모델 은 인 프 라 에 의해 반 전 적으로 정의 되기 시작했습니다 .
구 독 은 원래 채 팅 과 가 벼 운 호출 에 적합 했지만 긴 링크 프 록 시 작업 에 배치 되면 비용 과 스케 줄 이 빠르게 불 균 형 합니다 .이것이 업 계가 " 쿼 터 " 의 징 후 를 보 이기 시작한 이유입니다 .모델 이 갑자기 퇴 보 하는 것이 아니라 고 강 도 에이 전 티 워크 로드 가 플랫폼 을 배 포 규칙을 다시 작성 하도록 강요 하고 있습니다 .
이는 K V 캐 시 압 력 , 그래 픽 메모리 사용 량 , 메모리 대 역 폭 요구 사항 및 시스템 스케 줄 링 복잡 성을 직접 적으로 증가 시킵니다 .일단 네 이 티브 다 중 모 드와 지속적인 실행 을 중 첩 하면 병 목 현 상은 교육 에서 추 론 으로 이동 합니다 .이러한 종류의 작업을 안정 적으로 실행 할 수있는 사람은 차 세 대 AI 플랫폼 에 대한 티켓 을 진정으로 소유 합니다 .
다음 단계는 G PT - 6 를 먼저 부르는 사람이 아니라 긴 컨 텍 스트 , 다 중 도구 협 업 및 지속적인 실행 을 확장 가능한 서비스 로 만드는 사람입니다 .이 전투 는 표 면 적으로 모델 보다 바닥 보다 계산 력 전달 능력 입니다 .