Przegląd WebShift: Narzędzie do czyszczenia HTML
WebShift to biblioteka Rust i serwer MCP, który przekształca zanieczyszczone strony internetowe w czysty tekst odpowiedni do analizy przez modele językowe. Główne funkcje obejmują denoizację HTML, ekstrakcję i manipulację węzłami tekstowymi oraz możliwość działania jako serwer zapytań webowych. Dzięki różnorodnym opcjom konfiguracji, użytkownicy mogą dostosować WebShift do swoich potrzeb, w tym ustalać limity rozmiaru tekstu i wybierać różne backendy wyszukiwania.





