TeguNews hoạt động thế nào
TeguNews là trang tổng hợp tin tức tự động, đa ngôn ngữ. Chúng tôi không có phóng viên — hệ thống liên tục thu thập, khử trùng lặp, (tùy chọn) tóm tắt bằng AI và đăng lại tin từ nhiều nguồn công khai, luôn dẫn link về bài gốc. Bộ máy phía sau là một pipeline mở mang tên “pool news distribution system”.
Quy trình
1 · Thu thập
Thu thập hơn 10 nguồn RSS bằng tiếng Anh, Việt, Nhật, Hàn và nhiều thứ tiếng khác, vài phút một lần, có giới hạn tần suất theo từng tên miền để truy cập lịch sự.
2 · Khử trùng lặp
Phát hiện bài gần trùng bằng SimHash 64-bit trên tiêu đề đã chuẩn hóa (khoảng cách Hamming ≤ 3) — cùng một câu chuyện từ nhiều báo chỉ hiển thị một lần.
3 · Lưu trữ
Bài mới nằm trong bộ nhớ nhanh (Redis, cửa sổ “nóng” ~24 giờ); mỗi bài có ID ổn định (SHA-256 của nguồn + URL).
4 · Xử lý AI (tùy chọn)
Một số kênh được làm giàu nội dung — tóm tắt song ngữ, tổng hợp đa nguồn theo chủ đề, hoặc tranh luận 4 tác nhân (lạc quan / bi quan / phân tích / hoài nghi). Nội dung do AI tạo được gắn nhãn “Tổng hợp” rõ ràng.
5 · Phân phối qua kênh
Mỗi bên tiêu thụ (như trang này) là một “kênh” tự kéo bài theo lịch riêng từ API theo kênh (/api/channels/tegunews.com/news), lọc theo chuyên mục, nguồn và ngôn ngữ.
6 · Trang này
TeguNews hiển thị kênh đó bằng giao diện này — chia thành 15 chuyên mục, duyệt theo ngôn ngữ tin, làm mới vài phút một lần. Lớp chống bot (Cloudflare Turnstile) bảo vệ trang mà không chặn công cụ tìm kiếm.
Sản phẩm dùng dịch vụ TeguNews
Một số hệ thống đang dùng luồng tin của TeguNews làm nguyên liệu:
agent-socials
Hệ thống đa tác nhân quản lý nhiều tài khoản mạng xã hội (X, Meta, Threads, LinkedIn), mỗi tài khoản một “persona” riêng. Vòng lặp sản xuất → phân phối → đo lường → phân tích → tương tác → phản hồi, lấy luồng tin TeguNews làm nguồn nội dung.
Phân phối tin theo ngành
Quản lý và điều phối hệ thống tin cho các tài khoản X chuyên đề — breaking news, crypto, công nghệ… — mỗi tài khoản nhận đúng chuyên mục, nguồn và ngôn ngữ qua kênh riêng.
Bản tin (newsletter)
Tự động dựng các bản tin định kỳ từ tin đã tổng hợp và tóm tắt, phân theo chủ đề và ngôn ngữ.
Mô phỏng tranh luận xã hội
Tạo các cuộc tranh luận mô phỏng trên mạng xã hội về một chủ đề, dùng chế độ debate đa tác nhân (lạc quan / bi quan / phân tích / hoài nghi).
Minh bạch nguồn
Chúng tôi tổng hợp, không nhận là tác giả. Mỗi bài đều ghi tên nguồn và dẫn link về bài gốc; phần tóm tắt là nội dung phái sinh, không phải tác nghiệp gốc. Hãy mở link nguồn để đọc bản đầy đủ, chính thống.
Hai trục ngôn ngữ
Ngôn ngữ giao diện (chữ trên web) và ngôn ngữ tin (chọn bài theo ngôn ngữ nguồn) là độc lập — đổi riêng từng cái ở thanh trên cùng.
Bộ máy: pool-news-distribution-system (FastAPI + Redis).