BRAIP ads_banner

Tetrate e Bloomberg lançam o Envoy AI Gateway open source, construído no projeto Envoy Gateway da CNCF

CasaNotícias

Tetrate e Bloomberg lançam o Envoy AI Gateway open source, construído no projeto Envoy Gateway da CNCF

Bloomberg lança solução de dados que atende normas da NAIC
Bloomberg BFIX apresenta as primeiras taxas de câmbio fixas de valor D+1
Bloomberg facilita o acesso aos dados ESG para a Diretiva de Relatórios de Sustentabilidade Corporativa (CSRD)

Lançamento expande as capacidades do Envoy; Bloomberg usa o projeto para acelerar o desenvolvimento de aplicações de IA generativa.

A Bloomberg e a Tetrate cumpriram suas intenções, anunciadas pela primeira vez em outubro de 2024, de desenvolver um conjunto inovador e comunitário de funcionalidades principais de gateway de IA para integração empresarial. Hoje, os parceiros da comunidade anunciaram que a primeira versão estável (v0.1) do projeto open source Envoy AI Gateway já está disponível para download no GitHub, para que os desenvolvedores possam usá-lo como parte da infraestrutura de aplicações empresariais de IA.

O primeiro projeto de gateway de IA open source apoiado pela Cloud Native Computing Foundation (CNCF), o Envoy AI Gateway democratiza a infraestrutura de IA para organizações de todos os tamanhos e fornece uma interface de API para desenvolvedores que integram aplicações com serviços de IA generativa. O Envoy AI Gateway atende às necessidades das empresas em termos de robustez, escalabilidade e adaptabilidade em um cenário de IA generativa (GenAI) em constante mudança.

Essa iniciativa open source é uma resposta aos desafios que as empresas enfrentam ao adotar e integrar a IA em suas aplicações em grande escala. Ao estabelecer as bases para plataformas de IA escaláveis, os engenheiros da Tetrate e da Bloomberg estão atendendo às necessidades imediatas das empresas de hoje e preparando o caminho para o futuro das aplicações de IA em ambientes cloud-native.

***Comece agora com o Guia de Instalação do Envoy AI Gateway***

O Envoy AI Gateway aproveita as capacidades do projeto Envoy Gateway da CNCF, uma das implementações da Kubernetes Gateway API. Ele utiliza a base robusta e escalável do Envoy e permite que as organizações integrem funcionalidades modernas de GenAI em seus fluxos de trabalho e aplicações. O Envoy AI Gateway direciona solicitações para vários provedores e modelos de serviços de IA por meio de uma única camada de proxy reverso e oferece uma camada de API unificada com a qual os desenvolvedores interagem.

A versão inicial do Envoy AI Gateway oferece as seguintes funcionalidades:

  • API unificada: simplifica a integração do cliente com múltiplos provedores de LLM, oferecendo uma interface contínua. A versão 0.1 inclui integrações com AWS Bedrock e OpenAI.
  • Autorização Upstream: facilita o login com múltiplos provedores de serviços LLM por meio de credenciais fáceis de configurar e gerenciar.
  • Limitação de Taxa de Uso: baseada em tokens de palavras, garantindo controle de custos e operacional. As taxas de tokens podem ser limitadas por provedor de LLM, personalizadas por modelo ou ajustadas para cada cliente em um período definido.

De acordo com Varun Talwar, fundador da Tetrate: “O Envoy está se tornando rapidamente a comunidade de escolha para inovação em IA”. Talwar completa: “A Tetrate está trabalhando ativamente não apenas para contribuir com o Envoy, mas também para construir em cima do projeto e ajudar as organizações a entregar projetos de GenAI mais rapidamente e com mais confiabilidade, maximizando o retorno sobre o investimento no processo. A disponibilidade do Envoy AI Gateway como uma alternativa aos gateways Python é um grande avanço para o setor.”

Envoy AI Gateway ajudará a Bloomberg a escalar o desenvolvimento de aplicações GenAI

A Bloomberg está usando o Envoy AI Gateway para construir aplicações de IA generativa que interagem com serviços de GenAI – tanto on-premises quanto na nuvem – em grande escala. O Gateway oferece à Bloomberg um ponto central para gerenciar o uso de serviços GenAI por meio de uma API consistente e unificada – independentemente do provedor – estabelecendo limites e cotas e aplicando de forma consistente o controle de acesso aos serviços GenAI em toda a infraestrutura de IA da empresa. Essa abordagem simplifica o desenvolvimento de aplicações de IA generativa e ajudará os engenheiros da empresa a criar serviços inovadores de IA mais rapidamente para os usuários da Bloomberg.

Segundo Steven Bower, gerente do grupo de engenharia de serviços de computação cloud-native da Bloomberg: “Contribuir e construir com soluções open source e de padrões abertos é algo que valorizamos e no qual investimos na Bloomberg. O Envoy AI Gateway permitirá que a Bloomberg equipe seus engenheiros com a infraestrutura necessária para entregar aplicações de IA generativa rapidamente e em escala. Colaboramos com a Tetrate para levar esse projeto à sua primeira versão estável, e estamos animados para compartilhar essa inovadora solução empresarial de IA com a comunidade CNCF.”

Próximos passos para o projeto Envoy AI Gateway

Os organizadores da comunidade já identificaram vários novos recursos que agora estão no roadmap do projeto, incluindo:

  • Integração com Google Gemini 2.0: pronta para uso.
  • Lógica de Fallback de Provedor e Modelo: para garantir a continuidade dos serviços caso um serviço de IA se torne temporariamente indisponível.
  • Modelagem de Prompt: para fornecer contexto consistente ao serviço LLM em diferentes solicitações.
  • Cache Semântico: para reduzir os custos de uso do LLM reutilizando respostas de solicitações semanticamente similares, minimizando interações caras com o LLM.

Origens do Projeto

A ideia inicial para o projeto Envoy AI Gateway surgiu quando Dan Sun, líder da equipe de engenharia do time de IA Inference dos Serviços de Computação Nativa na Nuvem da Bloomberg e cofundador/maintainer do projeto KServe, descreveu para a comunidade Envoy a necessidade empresarial de uma plataforma interna de IA baseada em tecnologias open source, principalmente Envoy e Kubernetes. A Tetrate, uma importante colaboradora upstream do projeto Envoy, se prontificou a ajudar a transformar a visão da API do Envoy AI Gateway em realidade. Se você gostou desse post, não esqueça de compartilhar sobre o projeto aqui.

Saiba mais, comece e participe

Sobre a Tetrate

Com raízes no open source, a Tetrate foi fundada para resolver os desafios de rede e segurança de aplicações criados pela computação moderna, permitindo que empresas inovem com rapidez e segurança em ambientes híbridos e multi-nuvem. À medida que as aplicações evoluem para coleções de microsserviços descentralizados, monitorar e gerenciar as comunicações de rede e a segurança entre esses inúmeros serviços se torna um desafio. Por isso, algumas das maiores instituições financeiras, governos e outras empresas confiam na Tetrate para oferecer redes modernas de aplicações e segurança. Saiba mais em tetrate.io.

###

Fonte: Externa

BRAIP ads_banner