MAI-1, a nova inteligência artificial da Microsoft, liderada por ex-chefe da Inflection, pode ter 500 bilhões de parâmetros e ameaçar o domínio de concorrentes.

A Microsoft está desenvolvendo um novo modelo de linguagem artificial (IA) de grande escala chamado MAI-1, que tem potencial para competir com os modelos mais avançados do Google, Anthropic e OpenAI, de acordo com um relatório do The Information. Esta é a primeira vez que a Microsoft cria um modelo de IA interno dessa magnitude desde o investimento de mais de US$ 10 bilhões na OpenAI para obter os direitos de reutilizar seus modelos.
O GPT-4 da OpenAI é a base não apenas do ChatGPT, mas também do Microsoft Copilot, uma ferramenta de programação que auxilia desenvolvedores.
O desenvolvimento do MAI-1 é liderado por Mustafa Suleyman, ex-líder de IA do Google que recentemente atuou como CEO da startup de IA Inflection. A Microsoft adquiriu a maior parte da equipe e propriedade intelectual da startup por US$ 650 milhões em março. Embora o MAI-1 possa se basear em técnicas trazidas pela equipe da Inflection, ele é considerado um modelo de linguagem totalmente novo, de acordo com dois funcionários da Microsoft familiarizados com o projeto.
Com aproximadamente 500 bilhões de parâmetros, o MAI-1 será significativamente maior que os modelos anteriores de código aberto da Microsoft (como o Phi-3). Isso exigirá mais poder computacional e dados de treinamento, colocando-o em uma liga semelhante ao GPT-4 da OpenAI, que (segundo rumores) tem mais de 1 trilhão de parâmetros e está bem acima de modelos menores como os modelos de 70 bilhões de parâmetros da Meta e da Mistral.
O desenvolvimento do MAI-1 sugere uma abordagem dupla da Microsoft em relação à IA, focando em modelos de linguagem locais e pequenos para dispositivos móveis e modelos de ponta maiores baseados na nuvem. A Apple também está explorando uma estratégia similar. Isso também destaca a vontade da empresa de explorar o desenvolvimento de IA independentemente da OpenAI, cuja tecnologia atualmente alimenta os recursos de IA generativa mais ambiciosos da Microsoft, incluindo um chatbot integrado ao Windows.
O objetivo exato do MAI-1 ainda não foi determinado (mesmo dentro da Microsoft), e seu uso ideal dependerá de seu desempenho. Para treinar o modelo, a Microsoft está alocando um grande cluster de servidores com GPUs Nvidia e compilando dados de treinamento de várias fontes, incluindo texto gerado pelo GPT-4 da OpenAI e dados públicos da internet.
Dependendo do progresso feito nas próximas semanas, a Microsoft pode apresentar o MAI-1 em uma conferência para desenvolvedores ainda este mês, de acordo com uma das fontes citadas pela publicação.
Fonte: arstechnica.com
Mais sobre IAs aqui!