A Hugging Face apresentou sua oferta mais recente, Hugging Face Generative AI Services (HUGS), que visa simplificar a implantação e o dimensionamento de aplicativos generativos de IA usando modelos de código aberto.
Construído com base em tecnologias Hugging Face, como Transformers e Text Generation Inference (TGI), o HUGS promete desempenho otimizado em vários aceleradores de hardware.
Para desenvolvedores que usam AWS ou Google Cloud, o serviço está disponível por US$ 1 por hora por contêiner, com uma avaliação gratuita de cinco dias na AWS para ajudar os usuários a começar.
Simplificando a IA com inferência de configuração zero
O HUGS oferece aos desenvolvedores uma solução para executar modelos de IA em sua própria infraestrutura sem a necessidade de configuração manual. Um dos principais desafios ao implantar grandes modelos de linguagem (LLMs) é otimizá-los para ambientes de hardware específicos. Cada acelerador, seja uma GPU NVIDIA ou uma GPU AMD, requer ajuste fino para extrair o máximo desempenho.
Com o HUGS, essas otimizações são gerenciadas automaticamente, proporcionando alto rendimento pronto para uso. Além das GPUs NVIDIA e AMD, a empresa promete que em breve seu suporte se estenderá às TPUs AWS Inferentia e Google.
Hugging Face visa facilitar a transição de APIs de caixa preta para soluções abertas e auto-hospedadas com suporte para uma ampla gama de modelos, incluindo LLMs bem conhecidos como Llama e Gemma, com planos para introduzir modelos multimodais como Idefics e Llava em breve . No futuro, a empresa afirma que incluirá modelos de incorporação como BGE e Jina, dando aos desenvolvedores ainda mais opções para personalizar seus aplicativos de IA.
Este serviço utiliza APIs padronizadas compatíveis com as interfaces do modelo OpenAI, portanto, os desenvolvedores podem migrar seu próprio código.
Para startups em particular, o HUGS oferece uma oportunidade de construir aplicações de IA sem incorrer nos altos custos associados a plataformas proprietárias. A disponibilidade de implantações com um clique na DigitalOcean torna ainda mais fácil para pequenas equipes experimentarem tecnologias generativas de IA.
Enquanto isso, empresas maiores podem aproveitar o HUGS para dimensionar seus aplicativos sem ficarem presas a um único provedor de nuvem ou API proprietária. Na DigitalOcean, o HUGS está incluído sem nenhum custo extra além do custo padrão dos GPU Droplets. Hugging Face também oferece soluções de implantação personalizadas para empresas por meio de seu Enterprise Hub.