Blog Bitflix

IA aplicada, sem hype.

Adaptações editoriais. Cada artigo cita a fonte e marca a assistência de IA com transparência.

club-3090: receitas para servir LLMs grandes em RTX 3090

club-3090 reúne receitas comunitárias otimizadas para rodar modelos grandes, como Qwen de dezenas de bilhões de parâmetros, em RTX 3090 usando configurações de vLLM e llama.cpp.

Milton Bastos04/05/2026

Data/AIBitflix Take

FlashQLA: kernels de atenção linear de alta performance da Qwen

FlashQLA é uma biblioteca de kernels de atenção linear baseada em TileLang, com fusão de operadores e reformulações para acelerar treinamento e inferência em GPUs NVIDIA Hopper.

Milton Bastos04/05/2026

Data/AIBitflix Take

OpenKB: wiki persistente para conhecimento que se acumula

OpenKB implementa a ideia de LLM Wiki: compilar PDFs e Markdown em uma wiki interligada e persistente, usando indexação em árvore em vez de depender só de bancos vetoriais tradicionais.

Milton Bastos04/05/2026

RAGBitflix Take

hypatia: memória leve em Rust com SQLite FTS5 e DuckDB

hypatia é um sistema de memória em Rust que usa SQLite FTS5, DuckDB e uma linguagem JSON de consulta, sem depender de embeddings ou vector database.

Milton Bastos04/05/2026

Data/AIBitflix Take

LiteParse: fatos extraídos com evidência visual no documento

LiteParse gera relatórios HTML estruturados em que cada fato extraído de documentos aponta para o trecho exato da fonte com bounding box interativa.

Milton Bastos04/05/2026