CEO & Тимлид
18 июня 2025
Есть 10 каналов. Потом 50. Потом ты ставишь «прочитано» на глаз, чтобы совесть не мучила. Новости дублируются, какие‑то удаляются, важное уходит в никуда.
Я сам прошел через это. И решил: хватит. Надо что‑то, что само собирает информацию, понимает, о чём она, отвечает на вопросы и выполняет команды, типа:
RAG = Retrieval‑Augmented Generation — подход, где ИИ не просто «фантазирует», а достаёт знания из базы данных и использует их в ответах. Это комбо: «поиск + генерация».
Результат:
async function getEmbedding(text) {
const {
data: [{ embedding }],
} = await openai.embeddings.create({
model: 'text-embedding-3-small',
input: text,
encoding_format: 'float',
});
return embedding;
}
/* Эта функция отправляет текст в OpenAI, чтобы получить вектор (embedding) —
числовое представление смысла.
Например, «Нефть подорожала» и «Цены на нефть выросли»
будут иметь похожие вектора. */
async function findSimilarPosts(query, top_k = 20) {
const vector = await getEmbedding(query);
const results = await qdrant.search('tg_posts', {
vector,
limit: top_k,
});
return results.map((r) => ({
id: r.id,
score: r.score,
text: r.payload.text,
}));
}
/* Что делает эта функция:
Превращает текстовый запрос пользователя в вектор.
Находит в Qdrant посты, у которых похожее смысловое представление.
Возвращает список подходящих постов — по степени близости. \*/
Характеристика | Keyword Search | RAG-поиск |
---|---|---|
Поиск | По словам | По смыслу |
Синонимы | Не работает | Работает (например, “ИТ” и “айти”) |
Ошибки формулировки | Критично | Терпимо |
Галлюцинации в ответах | Нет, но и ответов особо нет | Нет — GPT работает на фактах из базы |
Требует точной формулировки | Да | Нет |
Ранее:
Сейчас:
Совокупность этого позволяет собрать простое MVP за неделю — и именно так мы и сделали.
Сколько это стоит?
$10–30/мес: VPS + OpenAI API. Можно дешевле с локальными моделями.
Это легально?
Да, парсятся только публичные каналы, работает через официальный Telegram userbot — никаких незаконных действий.
А если канал удалил пост?
Мы фиксируем дату и ID. Видим «пост был», даже если он исчез — это важнее.
Можно ли искать по эмоциям и тону?
Да — считаем сентимент, строим графики, ловим негатив/позитив по трендам.
Соберём MVP за 2–3 недели. Подключим нужные каналы, адаптируем визуал. Без бюрократии, душных созвонов на 12 человек и вечного согласования.
Telegram: @madmaterials_bot
Почта: team@madmaterials.com
Рустам
CEO & Тимлид