Blog Bitflix
IA aplicada, sem hype.
Adaptações editoriais. Cada artigo cita a fonte e marca a assistência de IA com transparência.
Ver catálogo open sourceclub-3090: receitas para servir LLMs grandes em RTX 3090
club-3090 reúne receitas comunitárias otimizadas para rodar modelos grandes, como Qwen de dezenas de bilhões de parâmetros, em RTX 3090 usando configurações de vLLM e llama.cpp.
FlashQLA: kernels de atenção linear de alta performance da Qwen
FlashQLA é uma biblioteca de kernels de atenção linear baseada em TileLang, com fusão de operadores e reformulações para acelerar treinamento e inferência em GPUs NVIDIA Hopper.
OpenKB: wiki persistente para conhecimento que se acumula
OpenKB implementa a ideia de LLM Wiki: compilar PDFs e Markdown em uma wiki interligada e persistente, usando indexação em árvore em vez de depender só de bancos vetoriais tradicionais.
hypatia: memória leve em Rust com SQLite FTS5 e DuckDB
hypatia é um sistema de memória em Rust que usa SQLite FTS5, DuckDB e uma linguagem JSON de consulta, sem depender de embeddings ou vector database.
LiteParse: fatos extraídos com evidência visual no documento
LiteParse gera relatórios HTML estruturados em que cada fato extraído de documentos aponta para o trecho exato da fonte com bounding box interativa.