"\u0421\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430, \u0438\u043B\u0438 \u0428\u0443\u043C\u043E\u0432\u044B\u0435 \u0441\u043B\u043E\u0432\u0430, \u2014 \u0442\u0435\u0440\u043C\u0438\u043D \u0438\u0437 \u0442\u0435\u043E\u0440\u0438\u0438 \u043F\u043E\u0438\u0441\u043A\u0430 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 \u043F\u043E \u043A\u043B\u044E\u0447\u0435\u0432\u044B\u043C \u0441\u043B\u043E\u0432\u0430\u043C. \u0421\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430 \u043C\u043E\u0433\u0443\u0442 \u0434\u0435\u043B\u0438\u0442\u044C\u0441\u044F \u043D\u0430 \u043E\u0431\u0449\u0438\u0435 \u0438 \u0437\u0430\u0432\u0438\u0441\u0438\u043C\u044B\u0435. \u041A \u043E\u0431\u0449\u0438\u043C \u043C\u043E\u0436\u043D\u043E \u043E\u0442\u043D\u0435\u0441\u0442\u0438 \u043F\u0440\u0435\u0434\u043B\u043E\u0433\u0438, \u0441\u0443\u0444\u0444\u0438\u043A\u0441\u044B, \u043F\u0440\u0438\u0447\u0430\u0441\u0442\u0438\u044F, \u043C\u0435\u0436\u0434\u043E\u043C\u0435\u0442\u0438\u044F, \u0446\u0438\u0444\u0440\u044B, \u0447\u0430\u0441\u0442\u0438\u0446\u044B \u0438 \u0442. \u043F. \u041E\u0431\u0449\u0438\u0435 \u0448\u0443\u043C\u043E\u0432\u044B\u0435 \u0441\u043B\u043E\u0432\u0430 \u0432\u0441\u0435\u0433\u0434\u0430 \u0438\u0441\u043A\u043B\u044E\u0447\u0430\u044E\u0442\u0441\u044F \u0438\u0437 \u043F\u043E\u0438\u0441\u043A\u043E\u0432\u043E\u0433\u043E \u0437\u0430\u043F\u0440\u043E\u0441\u0430 (\u0437\u0430 \u0438\u0441\u043A\u043B\u044E\u0447\u0435\u043D\u0438\u0435\u043C \u043F\u043E\u0438\u0441\u043A\u0430 \u043F\u043E \u0441\u0442\u0440\u043E\u0433\u043E\u043C\u0443 \u0441\u043E\u043E\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0438\u044E \u043F\u043E\u0438\u0441\u043A\u043E\u0432\u043E\u0439 \u0444\u0440\u0430\u0437\u044B), \u0442\u0430\u043A\u0436\u0435 \u043E\u043D\u0438 \u0438\u0433\u043D\u043E\u0440\u0438\u0440\u0443\u044E\u0442\u0441\u044F \u043F\u0440\u0438 \u043F\u043E\u0441\u0442\u0440\u043E\u0435\u043D\u0438\u0438 \u0438\u043D\u0432\u0435\u0440\u0442\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u043E\u0433\u043E \u0438\u043D\u0434\u0435\u043A\u0441\u0430. \u0421\u0447\u0438\u0442\u0430\u0435\u0442\u0441\u044F, \u0447\u0442\u043E \u043A\u0430\u0436\u0434\u043E\u0435 \u0438\u0437 \u043E\u0431\u0449\u0438\u0445 \u0441\u0442\u043E\u043F-\u0441\u043B\u043E\u0432 \u0435\u0441\u0442\u044C \u043F\u043E\u0447\u0442\u0438 \u0432\u043E \u0432\u0441\u0435\u0445 \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u0430\u0445 \u043A\u043E\u043B\u043B\u0435\u043A\u0446\u0438\u0438. \n* \u041F\u0443\u0448\u043A\u0438\u043D, \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440, \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447 \n* \u041F\u0443\u0448\u043A\u0438\u043D, \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440 \n* \u041F\u0443\u0448\u043A\u0438\u043D, \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447 \n* \u041F\u0443\u0448\u043A\u0438\u043D"@ru . . . . . "1015600"^^ . . "Dins la inform\u00E0tica, les paraules buides o mots buits s\u00F3n llistes de paraules que es filtren durant el processament del llenguatge natural. No hi ha cap llista universal de paraules buides que s'utilitzi en totes les eines de processament de llenguatge natural, i de fet no totes les eines utilitzen una llista aix\u00ED. Fins i tot, algunes eines eviten eliminar les paraules buides per tal de permetre, per exemple, la cerca de frases. Per la xarxa es poden trobar diverses llistes de paraules buides per al catal\u00E0"@ca . "Stoppw\u00F6rter nennt man in der Informationsr\u00FCckgewinnung bzw. im Information Retrieval W\u00F6rter, die bei einer Volltextindexierung nicht beachtet werden, da sie sehr h\u00E4ufig auftreten und gew\u00F6hnlich keine Relevanz f\u00FCr die Erfassung des Dokumentinhalts besitzen. Die Stoppw\u00F6rter befanden sich bei \u00E4lteren Suchmaschinen gew\u00F6hnlich auf einer Liste und wurden aus dem Text entfernt und nicht indexiert. Heute basieren die meisten Internet-Suchmaschinen auf Vollindexierung, dabei werden die Stoppw\u00F6rter angezeigt, tragen aber nichts zur Suche bei. Es handelt sich \u00FCblicherweise bei den Stoppw\u00F6rtern um die am h\u00E4ufigsten vorkommenden W\u00F6rter einer Sprache. Man spricht dann auch von einer \u201Efesten Stoppwortliste\u201C. Allen Stoppw\u00F6rtern ist gemeinsam, dass sie vor allem grammatikalische/syntaktische Funktionen \u00FCbernehmen und daher keine R\u00FCckschl\u00FCsse auf den Inhalt des Dokumentes zulassen. Eine weitere Gemeinsamkeit ist ihre gro\u00DFe Zahl: Sie treten in jedem Dokument sehr oft auf und kommen in sehr vielen Dokumenten vor, wodurch sie bei der Erschlie\u00DFung der Dokumente einen hohen Aufwand verursachen w\u00FCrden. Handelt es sich um die am h\u00E4ufigsten vorkommenden W\u00F6rter einer Menge von Dokumenten (beispielsweise Akten und Berichte) spricht man von einer \u201Eberechneten Stoppwortliste\u201C. Das Erkennen von Stoppw\u00F6rtern macht Suchmaschinen effizienter. W\u00FCrde man Stoppw\u00F6rter bei einem Suchauftrag beachten, w\u00E4re nahezu jedes Dokument ein Treffer. Ein solches Suchergebnis w\u00E4re f\u00FCr den Anwender nutzlos. Allerdings ist es nicht immer sinnvoll, Stoppw\u00F6rter komplett auszublenden. Beispiele hierf\u00FCr sind im Englischen die Rockgruppe \u201EThe Who\u201C oder im Deutschen \u201EDie \u00C4rzte\u201C und Personen mit dem Nachnamen \u201EWeil\u201C. Daher ist es heute, bei Vollindizierung, m\u00F6glich auch nach diesen Kombinationen suchen zu lassen. Fr\u00FCher war dazu bei den meisten Suchmaschinen ein Operator notwendig, zum Beispiel \u201E+\u201C oder die Phrasensuche. Allgemein \u00FCbliche Stoppw\u00F6rter in deutschsprachigen Dokumenten sind bestimmte Artikel ('der', 'die', 'das'), unbestimmte Artikel ('einer', 'eine', 'ein'), Konjunktionen (z. B. 'und', 'oder', 'doch', 'weil') und h\u00E4ufig gebrauchte Pr\u00E4positionen (z. B. 'an', 'in', 'von') sowie die Negation 'nicht'. Im Englischen sind unter anderem 'a', 'of', 'the', 'I', 'it', 'you' und 'and' Stoppw\u00F6rter. Abh\u00E4ngig von den zu erschlie\u00DFenden Dokumenten k\u00F6nnen Stoppw\u00F6rter auch mehrsprachig vorliegen. Obwohl eher als Stoppzeichen zu benennen, werden h\u00E4ufig auch der Punkt (.), das Komma und der Strichpunkt als Stoppw\u00F6rter bezeichnet. In der freien Software-Bibliothek NLTK sind Listen von Stoppw\u00F6rtern f\u00FCr 21 Sprachen sowie fertige Methoden zu deren Benutzung enthalten. Hans Peter Luhn, einer der Pioniere des Information Retrieval, pr\u00E4gte den Begriff der Stoppw\u00F6rter und benutzte dieses Konzept im Design und in der Implementation des Indexers KWIC. Abzugrenzen ist das Stoppwort von den sogenannten Black Lists, dabei handelt es sich um eine Liste von unzul\u00E4ssigen W\u00F6rtern. Das Vorkommen eines solchen f\u00FChrt nicht zum Ausschluss des Wortes aus der Indizierung, sondern zur Elimination des gesamten Dokuments."@de . . "Stopslovo"@cs . . . "Stop words are the words in a stop list (or stoplist or negative dictionary) which are filtered out (i.e. stopped) before or after processing of natural language data (text) because they are insignificant. There is no single universal list of stop words used by all natural language processing tools, nor any agreed upon rules for identifying stop words, and indeed not all tools even use such a list. Therefore, any group of words can be chosen as the stop words for a given purpose. The \"general trend in [information retrieval] systems over time has been from standard use of quite large stop lists (200\u2013300 terms) to very small stop lists (7\u201312 terms) to no stop list whatsoever\"."@en . "Stop word"@en . . . . "Stoppord \u00E4r betydelsefattiga ord som f\u00F6rekommer i n\u00E4stan alla texter och d\u00E4rf\u00F6r ibland ignoreras/filtreras bort i texts\u00F6kning, indexering och andra spr\u00E5kteknologiska sammanhang. N\u00E5gra svenska exempel \u00E4r i, och, eller, men, en, ett och att."@sv . . . "\u0627\u0633\u062A\u0628\u0639\u0627\u062F \u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u0634\u0627\u0626\u0639\u0629"@ar . . . . . . "Na computa\u00E7\u00E3o, uma palavra vazia (ou stop word, em ingl\u00EAs) \u00E9 uma palavra que \u00E9 removida antes ou ap\u00F3s o processamento de um texto em linguagem natural. N\u00E3o existe uma lista universal de palavras vazias usadas por todas as ferramentas de processamento de linguagem natural e nem todas ferramentas fazem uso de uma lista dessas palavras. Algumas ferramentas, inclusive, evitam remover as chamadas \"palavras vazias\" para dar suporte \u00E0 busca de senten\u00E7as. Qualquer grupo de palavras pode ser escolhido como grupo de \"palavras vazias\" de acordo com o objetivo do processamento. Para alguns motores de busca, s\u00E3o selecionadas como palavras vazias as palavras mais comuns da l\u00EDngua e , como o, a, em e no. Embora a utiliza\u00E7\u00E3o de palavras vazias possa simplificar a an\u00E1lise do texto, o uso delas pode causar problemas por impedir a distin\u00E7\u00E3o de nomes que fazem uso delas para formar alguma entidade representativa do discurso, como em 'O Teatro M\u00E1gico', 'A Bela e a Fera' e 'Firefox OS'. Outros motores de busca removem as palavras mais comuns da busca com o intuito de melhorar o desempenho das buscas."@pt . "\u5728\u4FE1\u606F\u68C0\u7D22\u4E2D\uFF0C\u4E3A\u8282\u7701\u5B58\u50A8\u7A7A\u95F4\u548C\u63D0\u9AD8\u641C\u7D22\u6548\u7387\uFF0C\u5728\u81EA\u7136\u8BED\u8A00\u5904\u7406\u6570\u636E\uFF08\u6216\u6587\u672C\uFF09\u4E4B\u524D\u6216\u4E4B\u540E\u4F1A\u81EA\u52A8\u8FC7\u6EE4\u6389\u67D0\u4E9B\u5B57\u6216\u8BCD\uFF0C\u8FD9\u4E9B\u5B57\u6216\u8BCD\u5373\u88AB\u79F0\u4E3AStop Words(\u505C\u7528\u8BCD)\u3002\u4E0D\u8981\u628A\u505C\u7528\u8BCD\u4E0E\u5B89\u5168\u53E3\u4EE4\u6DF7\u6DC6\u3002\u8FD9\u4E9B\u505C\u7528\u8BCD\u90FD\u662F\u4EBA\u5DE5\u8F93\u5165\u3001\u975E\u81EA\u52A8\u5316\u751F\u6210\u7684\uFF0C\u751F\u6210\u540E\u7684\u505C\u7528\u8BCD\u4F1A\u5F62\u6210\u4E00\u4E2A\u505C\u7528\u8BCD\u8868\u3002\u4F46\u662F\uFF0C\u5E76\u6CA1\u6709\u4E00\u4E2A\u660E\u786E\u7684\u505C\u7528\u8BCD\u8868\u80FD\u591F\u9002\u7528\u4E8E\u6240\u6709\u7684\u5DE5\u5177\u3002\u751A\u81F3\u6709\u4E00\u4E9B\u5DE5\u5177\u662F\u660E\u786E\u5730\u907F\u514D\u4F7F\u7528\u505C\u7528\u8BCD\u6765\u652F\u6301\u7684\u3002 \u5BF9\u4E8E\u4E00\u4E2A\u7ED9\u5B9A\u7684\u76EE\u7684\uFF0C\u4EFB\u4F55\u4E00\u7C7B\u7684\u8BCD\u8BED\u90FD\u53EF\u4EE5\u88AB\u9009\u4F5C\u505C\u7528\u8BCD\u3002\u901A\u5E38\u610F\u4E49\u4E0A\uFF0C\u505C\u7528\u8BCD\u5927\u81F4\u5206\u4E3A\u4E24\u7C7B\u3002\u4E00\u7C7B\u662F\u4EBA\u7C7B\u8BED\u8A00\u4E2D\u5305\u542B\u7684\u529F\u80FD\u8BCD\uFF0C\u8FD9\u4E9B\u529F\u80FD\u8BCD\u6781\u5176\u666E\u904D\uFF0C\u4E0E\u5176\u4ED6\u8BCD\u76F8\u6BD4\uFF0C\u529F\u80FD\u8BCD\u6CA1\u6709\u4EC0\u4E48\u5B9E\u9645\u542B\u4E49\uFF0C\u6BD4\u5982'the'\u3001'is'\u3001'at'\u3001'which'\u3001'on'\u7B49\u3002\u4F46\u662F\u5BF9\u4E8E\u641C\u7D22\u5F15\u64CE\u6765\u8BF4\uFF0C\u5F53\u6240\u8981\u641C\u7D22\u7684\u77ED\u8BED\u5305\u542B\u529F\u80FD\u8BCD\uFF0C\u7279\u522B\u662F\u50CFThe Who\u3001The The\u6216Take That\u7B49\u590D\u5408\u540D\u8BCD\u65F6\uFF0C\u505C\u7528\u8BCD\u7684\u4F7F\u7528\u5C31\u4F1A\u5BFC\u81F4\u95EE\u9898\u3002\u53E6\u4E00\u7C7B\u8BCD\u5305\u62EC\u8BCD\u6C47\u8BCD\uFF0C\u6BD4\u5982'want'\u7B49\uFF0C\u8FD9\u4E9B\u8BCD\u5E94\u7528\u5341\u5206\u5E7F\u6CDB\uFF0C\u4F46\u662F\u5BF9\u8FD9\u6837\u7684\u8BCD\u641C\u7D22\u5F15\u64CE\u65E0\u6CD5\u4FDD\u8BC1\u80FD\u591F\u7ED9\u51FA\u771F\u6B63\u76F8\u5173\u7684\u641C\u7D22\u7ED3\u679C\uFF0C\u96BE\u4EE5\u5E2E\u52A9\u7F29\u5C0F\u641C\u7D22\u8303\u56F4\uFF0C\u540C\u65F6\u8FD8\u4F1A\u964D\u4F4E\u641C\u7D22\u7684\u6548\u7387\uFF0C\u6240\u4EE5\u901A\u5E38\u4F1A\u628A\u8FD9\u4E9B\u8BCD\u4ECE\u95EE\u9898\u4E2D\u79FB\u53BB\uFF0C\u4ECE\u800C\u63D0\u9AD8\u641C\u7D22\u6027\u80FD\u3002 \u4F5C\u4E3A\u4FE1\u606F\u68C0\u7D22\u7684\u5148\u9A71\u8005\u4E4B\u4E00\uFF0C\u521B\u9020\u4E86\u8FD9\u4E2A\u77ED\u8BED\uFF0C\u5E76\u5728\u4ED6\u7684\u7814\u7A76\u4E2D\u5E94\u7528\u8FD9\u4E2A\u6982\u5FF5\uFF0C\u63A8\u52A8\u4E86\u8FD9\u4E2A\u6982\u5FF5\u7684\u4F7F\u7528\u3002"@zh . . . "Stoppw\u00F6rter nennt man in der Informationsr\u00FCckgewinnung bzw. im Information Retrieval W\u00F6rter, die bei einer Volltextindexierung nicht beachtet werden, da sie sehr h\u00E4ufig auftreten und gew\u00F6hnlich keine Relevanz f\u00FCr die Erfassung des Dokumentinhalts besitzen. Die Stoppw\u00F6rter befanden sich bei \u00E4lteren Suchmaschinen gew\u00F6hnlich auf einer Liste und wurden aus dem Text entfernt und nicht indexiert. Heute basieren die meisten Internet-Suchmaschinen auf Vollindexierung, dabei werden die Stoppw\u00F6rter angezeigt, tragen aber nichts zur Suche bei."@de . "Palabras vac\u00EDas es el nombre que reciben las palabras sin significado como art\u00EDculos, pronombres, preposiciones, etc. que son filtradas antes o despu\u00E9s del procesamiento de datos en lenguaje natural (texto). A Hans Peter Luhn, uno de los pioneros en recuperaci\u00F3n de informaci\u00F3n, se le atribuye la acu\u00F1aci\u00F3n de la locuci\u00F3n inglesa stop words y el uso del concepto en su dise\u00F1o. Est\u00E1 controlada por introducci\u00F3n humana y no autom\u00E1tica."@es . "\u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u0634\u0627\u0626\u0639\u0629 (\u0628\u0627\u0644\u0625\u0646\u062C\u0644\u064A\u0632\u064A\u0629: stop words)\u200F \u0623\u0648 \u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u0645\u0633\u062A\u0628\u0639\u062F\u0629 \u0647\u064A \u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u062A\u064A \u062A\u0633\u062A\u0628\u0639\u062F \u0642\u0628\u0644 \u0627\u0644\u0645\u0639\u0627\u0644\u062C\u0629 \u0627\u0644\u0644\u063A\u0648\u064A\u0629 \u0627\u0644\u0622\u0644\u064A\u0629 \u0644\u0644\u0628\u064A\u0627\u0646\u0627\u062A (\u0646\u0635\u0648\u0635). \u0648\u0647\u064A \u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u062A\u064A \u062A\u062A\u0643\u0631\u0631 \u0641\u064A \u0627\u0644\u0646\u0635\u0648\u0635 \u0645\u062B\u0644 (\u0641\u064A\u060C \u0645\u0646\u060C \u0625\u0644\u0649...) \u0648\u064A\u0633\u062A\u062D\u0633\u0646 \u062A\u062C\u0627\u0647\u0644\u0647\u0627 \u0648\u0639\u062F\u0645 \u0641\u0647\u0631\u0633\u062A\u0647\u0627 \u0645\u0646 \u0623\u062C\u0644 \u062A\u062D\u0633\u064A\u0646 \u0627\u0644\u0628\u062D\u062B. \u0648\u064A\u0631\u062C\u0639 \u0627\u0644\u0641\u0636\u0644 (\u0645\u0646 \u0627\u0644\u0631\u0648\u0627\u062F \u0641\u064A \u0627\u0633\u062A\u0631\u062C\u0627\u0639 \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A) \u0641\u064A \u0627\u0633\u062A\u0639\u0645\u0627\u0644 \u0647\u0630\u0627 \u0627\u0644\u0645\u0635\u0637\u0644\u062D \u0648\u0627\u0644\u0645\u0641\u0647\u0648\u0645 \u0641\u064A \u0627\u0644\u062A\u0637\u0648\u064A\u0631."@ar . . . . . "\u505C\u7528\u8BCD"@zh . . . . . "1120852254"^^ . "\u0428\u0443\u043C\u043E\u0432\u0456 \u0441\u043B\u043E\u0432\u0430"@uk . "Stoppord (spr\u00E5kteknologi)"@sv . . . . . "Paraules buides"@ca . "Stop lista (wyszukiwarki)"@pl . "Palabra vac\u00EDa"@es . . "Stop lista (ang. stop word) \u2013 lista s\u0142\u00F3w odrzucanych przez wyszukiwarki internetowe w celu zredukowania wielko\u015Bci zbior\u00F3w. S\u0105 to s\u0142owa o ma\u0142ym znaczeniu (sp\u00F3jniki: i, oraz, lub) oraz s\u0142owa popularne (mp3, sex), czyli niewp\u0142ywaj\u0105ce na identyfikacj\u0119 dokumentu. Listy takie mo\u017Cna utworzy\u0107 dla okre\u015Blonej dziedziny lub dla okre\u015Blonego j\u0119zyka. Istniej\u0105 stop-listy dla j\u0119zyka angielskiego, zawieraj\u0105ce ok. 450 s\u0142\u00F3w. Usuwanie wyraz\u00F3w nieznacz\u0105cych z tekstu mo\u017Ce si\u0119 odbywa\u0107 w nast\u0119puj\u0105cy spos\u00F3b: \n* s\u0142ownikowy \u2013 z tekstu usuwane s\u0105 wyrazy wymienione w specjalnym s\u0142owniku, \n* statystyczny \u2013 z tekstu usuwane s\u0105 wyrazy, kt\u00F3rych cz\u0119sto\u015B\u0107 wyst\u0119powania znajduje si\u0119 w za\u0142o\u017Conym przedziale, \n* hybrydowy \u2013 po\u0142\u0105czenie powy\u017Cszych technik."@pl . . "Jako stopslova se p\u0159i po\u010D\u00EDta\u010Dov\u00E9m zpracov\u00E1n\u00ED p\u0159irozen\u00E9ho jazyka ozna\u010Duj\u00ED slova, kter\u00E1 se v dan\u00E9m jazyce vyskytuj\u00ED \u010Dasto, ale nenesou \u017E\u00E1dnou v\u00FDznamovou informaci, maj\u00ED zpravidla pouze syntaktick\u00FD v\u00FDznam. Typicky se jedn\u00E1 o spojky, p\u0159edlo\u017Eky atp. Seznam takov\u00FDch slov (t\u00E9\u017E ozna\u010Dovan\u00FD jako negativn\u00ED slovn\u00EDk) pou\u017E\u00EDvaj\u00ED plnotextov\u00E9 vyhled\u00E1va\u010De a p\u0159i sestavov\u00E1n\u00ED indexu tato slova zcela ignoruj\u00ED, nebo\u0165 jsou pro vyhled\u00E1v\u00E1n\u00ED neu\u017Eite\u010Dn\u00E1. P\u0159i pou\u017Eit\u00ED lemmatizace m\u016F\u017Ee slovn\u00EDk obsahovat pouze z\u00E1kladn\u00ED tvary, v opa\u010Dn\u00E9m p\u0159\u00EDpad\u011B mus\u00ED obsahovat v\u0161echny pou\u017E\u00EDvan\u00E9 tvary stopslov."@cs . "En recherche d'information, un mot vide (ou stop word, en anglais) est un mot qui est tellement commun qu'il est inutile de l'indexer ou de l'utiliser dans une recherche. En fran\u00E7ais, des mots vides \u00E9vidents pourraient \u00EAtre \u00AB le \u00BB, \u00AB la \u00BB, \u00AB de \u00BB, \u00AB du \u00BB, \u00AB ce \u00BB\u2026 Un mot vide est un mot non significatif figurant dans un texte. On l'oppose \u00E0 mot plein.La signification d'un mot s'\u00E9value \u00E0 partir de sa distribution (au sens statistique) dans une collection de textes. Un mot est dit \u00AB vide \u00BB si sa distribution est uniforme sur les textes de la collection. En d'autres termes, un mot qui appara\u00EEt avec une fr\u00E9quence semblable dans chacun des textes de la collection n'est pas discriminant car il ne permet pas de distinguer les textes les uns par rapport aux autres. Lorsque tous les textes de la collection sont r\u00E9dig\u00E9s dans une m\u00EAme langue, les mots vides sont principalement des mots caract\u00E9ristiques de cette langue comme les pr\u00E9positions, les articles, les pronoms. D'o\u00F9 l'assimilation courante entre mots vides et mots grammaticaux et partant, entre mots pleins et mots lexicaux (noms, verbes, adjectifs). Les listes pr\u00E9\u00E9tablies, dites de mots vides, utilis\u00E9es par les moteurs de recherche sont ainsi des listes de mots grammaticaux. Elles sont parfois appel\u00E9es \u00AB anti-dictionnaires \u00BB. Cependant dans une collection de textes r\u00E9unis autour d'un th\u00E8me commun, certains mots peuvent respecter une distribution uniforme. Ce sont alors des mots vides pour cette collection bien qu'ils ne soient pas des mots grammaticaux. D'autre part, certains mots grammaticaux sont assez rares pour constituer des mots pleins : via par exemple."@fr . . "\u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u0634\u0627\u0626\u0639\u0629 (\u0628\u0627\u0644\u0625\u0646\u062C\u0644\u064A\u0632\u064A\u0629: stop words)\u200F \u0623\u0648 \u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u0645\u0633\u062A\u0628\u0639\u062F\u0629 \u0647\u064A \u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u062A\u064A \u062A\u0633\u062A\u0628\u0639\u062F \u0642\u0628\u0644 \u0627\u0644\u0645\u0639\u0627\u0644\u062C\u0629 \u0627\u0644\u0644\u063A\u0648\u064A\u0629 \u0627\u0644\u0622\u0644\u064A\u0629 \u0644\u0644\u0628\u064A\u0627\u0646\u0627\u062A (\u0646\u0635\u0648\u0635). \u0648\u0647\u064A \u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u062A\u064A \u062A\u062A\u0643\u0631\u0631 \u0641\u064A \u0627\u0644\u0646\u0635\u0648\u0635 \u0645\u062B\u0644 (\u0641\u064A\u060C \u0645\u0646\u060C \u0625\u0644\u0649...) \u0648\u064A\u0633\u062A\u062D\u0633\u0646 \u062A\u062C\u0627\u0647\u0644\u0647\u0627 \u0648\u0639\u062F\u0645 \u0641\u0647\u0631\u0633\u062A\u0647\u0627 \u0645\u0646 \u0623\u062C\u0644 \u062A\u062D\u0633\u064A\u0646 \u0627\u0644\u0628\u062D\u062B. \u0648\u064A\u0631\u062C\u0639 \u0627\u0644\u0641\u0636\u0644 (\u0645\u0646 \u0627\u0644\u0631\u0648\u0627\u062F \u0641\u064A \u0627\u0633\u062A\u0631\u062C\u0627\u0639 \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A) \u0641\u064A \u0627\u0633\u062A\u0639\u0645\u0627\u0644 \u0647\u0630\u0627 \u0627\u0644\u0645\u0635\u0637\u0644\u062D \u0648\u0627\u0644\u0645\u0641\u0647\u0648\u0645 \u0641\u064A \u0627\u0644\u062A\u0637\u0648\u064A\u0631. \u0648\u062A\u0639\u062A\u0628\u0631 \u0647\u0630\u0647 \u0627\u0644\u0637\u0631\u064A\u0642\u0629 \u0645\u0642\u0627\u0631\u0628\u0629 \u0633\u0644\u0628\u064A\u0629 \u0641\u064A \u0627\u0644\u062A\u0639\u0627\u0645\u0644 \u0645\u0639 \u0627\u0644\u0623\u062F\u0648\u0627\u062A \u0648\u062D\u0631\u0648\u0641 \u0627\u0644\u0645\u0639\u0627\u0646\u064A \u0641\u064A \u0627\u0644\u062C\u0645\u0644.\u0644\u0627 \u062A\u0648\u062C\u062F \u0642\u0627\u0626\u0645\u0629 \u0643\u0644\u0645\u0627\u062A \u0645\u062D\u062F\u062F\u0629 \u0644\u0644\u0627\u0633\u062A\u0628\u0639\u0627\u062F\u060C \u062A\u0633\u062A\u0639\u0645\u0644\u0647\u0627 \u0643\u0644 \u0627\u0644\u0645\u062D\u0644\u0644\u0627\u062A \u0627\u0644\u0635\u0631\u0641\u064A\u0629 \u0648\u0623\u062F\u0648\u0627\u062A \u0645\u0639\u0627\u0644\u062C\u0629 \u0627\u0644\u0644\u063A\u0629 \u0627\u0644\u0637\u0628\u064A\u0639\u064A\u0629. \u0644\u0627 \u062A\u0633\u062A\u0639\u0645\u0644 \u0643\u0644 \u0623\u062F\u0648\u0627\u062A \u0627\u0644\u0645\u0639\u0627\u0644\u062C\u0629 \u0627\u0644\u0644\u063A\u0648\u064A\u0629 \u0642\u0627\u0626\u0645\u0629 \u0643\u0644\u0645\u0627\u062A \u0634\u0627\u0626\u0639\u0629.\u0648\u064A\u0645\u0643\u0646 \u0644\u0644\u062A\u062D\u0644\u064A\u0644 \u0627\u0644\u0635\u0631\u0641\u064A \u0627\u0644\u062A\u0642\u0644\u064A\u0644 \u0645\u0646 \u0627\u0633\u062A\u062E\u062F\u0627\u0645 \u0643\u0644\u0645\u0627\u062A \u0645\u0633\u062A\u0628\u0639\u062F\u0629\u060C \u0644\u0627 \u0633\u064A\u0645\u0627 \u0639\u0646\u062F \u062A\u062D\u0644\u064A\u0644 \u0627\u0644\u062C\u0645\u0644.\u0627\u0644\u0643\u0644\u0645\u0627\u062A \u0627\u0644\u0645\u0633\u062A\u0628\u0639\u062F\u0629 \u0642\u062F \u062A\u0633\u0628\u0628 \u0645\u0634\u0627\u0643\u0644 \u0639\u0646\u062F \u0627\u0633\u062A\u062E\u062F\u0627\u0645 \u0645\u062D\u0631\u0643 \u0628\u062D\u062B \u0644\u0644\u0628\u062D\u062B \u0639\u0646 \u0627\u0644\u0639\u0628\u0627\u0631\u0627\u062A \u0627\u0644\u062A\u064A \u062A\u062F\u062E\u0644 \u0641\u064A\u0647\u0627\u060C \u0644\u0627 \u0633\u064A\u0645\u0627 \u0641\u064A \u0623\u0633\u0645\u0627\u0621 \u0645\u062B\u0644 '\u0627\u0644\u0645\u0641\u0639\u0648\u0644 \u0628\u0647'\u060C \u0623\u0648 \u00AB\u0631\u0633\u0648\u0644 \u0645\u0646 \u0627\u0644\u0644\u0647\u00BB\u060C \u00AB\u0648\u0647\u0645\u00BB."@ar . . . . . . . . . . . "\u5728\u4FE1\u606F\u68C0\u7D22\u4E2D\uFF0C\u4E3A\u8282\u7701\u5B58\u50A8\u7A7A\u95F4\u548C\u63D0\u9AD8\u641C\u7D22\u6548\u7387\uFF0C\u5728\u81EA\u7136\u8BED\u8A00\u5904\u7406\u6570\u636E\uFF08\u6216\u6587\u672C\uFF09\u4E4B\u524D\u6216\u4E4B\u540E\u4F1A\u81EA\u52A8\u8FC7\u6EE4\u6389\u67D0\u4E9B\u5B57\u6216\u8BCD\uFF0C\u8FD9\u4E9B\u5B57\u6216\u8BCD\u5373\u88AB\u79F0\u4E3AStop Words(\u505C\u7528\u8BCD)\u3002\u4E0D\u8981\u628A\u505C\u7528\u8BCD\u4E0E\u5B89\u5168\u53E3\u4EE4\u6DF7\u6DC6\u3002\u8FD9\u4E9B\u505C\u7528\u8BCD\u90FD\u662F\u4EBA\u5DE5\u8F93\u5165\u3001\u975E\u81EA\u52A8\u5316\u751F\u6210\u7684\uFF0C\u751F\u6210\u540E\u7684\u505C\u7528\u8BCD\u4F1A\u5F62\u6210\u4E00\u4E2A\u505C\u7528\u8BCD\u8868\u3002\u4F46\u662F\uFF0C\u5E76\u6CA1\u6709\u4E00\u4E2A\u660E\u786E\u7684\u505C\u7528\u8BCD\u8868\u80FD\u591F\u9002\u7528\u4E8E\u6240\u6709\u7684\u5DE5\u5177\u3002\u751A\u81F3\u6709\u4E00\u4E9B\u5DE5\u5177\u662F\u660E\u786E\u5730\u907F\u514D\u4F7F\u7528\u505C\u7528\u8BCD\u6765\u652F\u6301\u7684\u3002 \u5BF9\u4E8E\u4E00\u4E2A\u7ED9\u5B9A\u7684\u76EE\u7684\uFF0C\u4EFB\u4F55\u4E00\u7C7B\u7684\u8BCD\u8BED\u90FD\u53EF\u4EE5\u88AB\u9009\u4F5C\u505C\u7528\u8BCD\u3002\u901A\u5E38\u610F\u4E49\u4E0A\uFF0C\u505C\u7528\u8BCD\u5927\u81F4\u5206\u4E3A\u4E24\u7C7B\u3002\u4E00\u7C7B\u662F\u4EBA\u7C7B\u8BED\u8A00\u4E2D\u5305\u542B\u7684\u529F\u80FD\u8BCD\uFF0C\u8FD9\u4E9B\u529F\u80FD\u8BCD\u6781\u5176\u666E\u904D\uFF0C\u4E0E\u5176\u4ED6\u8BCD\u76F8\u6BD4\uFF0C\u529F\u80FD\u8BCD\u6CA1\u6709\u4EC0\u4E48\u5B9E\u9645\u542B\u4E49\uFF0C\u6BD4\u5982'the'\u3001'is'\u3001'at'\u3001'which'\u3001'on'\u7B49\u3002\u4F46\u662F\u5BF9\u4E8E\u641C\u7D22\u5F15\u64CE\u6765\u8BF4\uFF0C\u5F53\u6240\u8981\u641C\u7D22\u7684\u77ED\u8BED\u5305\u542B\u529F\u80FD\u8BCD\uFF0C\u7279\u522B\u662F\u50CFThe Who\u3001The The\u6216Take That\u7B49\u590D\u5408\u540D\u8BCD\u65F6\uFF0C\u505C\u7528\u8BCD\u7684\u4F7F\u7528\u5C31\u4F1A\u5BFC\u81F4\u95EE\u9898\u3002\u53E6\u4E00\u7C7B\u8BCD\u5305\u62EC\u8BCD\u6C47\u8BCD\uFF0C\u6BD4\u5982'want'\u7B49\uFF0C\u8FD9\u4E9B\u8BCD\u5E94\u7528\u5341\u5206\u5E7F\u6CDB\uFF0C\u4F46\u662F\u5BF9\u8FD9\u6837\u7684\u8BCD\u641C\u7D22\u5F15\u64CE\u65E0\u6CD5\u4FDD\u8BC1\u80FD\u591F\u7ED9\u51FA\u771F\u6B63\u76F8\u5173\u7684\u641C\u7D22\u7ED3\u679C\uFF0C\u96BE\u4EE5\u5E2E\u52A9\u7F29\u5C0F\u641C\u7D22\u8303\u56F4\uFF0C\u540C\u65F6\u8FD8\u4F1A\u964D\u4F4E\u641C\u7D22\u7684\u6548\u7387\uFF0C\u6240\u4EE5\u901A\u5E38\u4F1A\u628A\u8FD9\u4E9B\u8BCD\u4ECE\u95EE\u9898\u4E2D\u79FB\u53BB\uFF0C\u4ECE\u800C\u63D0\u9AD8\u641C\u7D22\u6027\u80FD\u3002 \u4F5C\u4E3A\u4FE1\u606F\u68C0\u7D22\u7684\u5148\u9A71\u8005\u4E4B\u4E00\uFF0C\u521B\u9020\u4E86\u8FD9\u4E2A\u77ED\u8BED\uFF0C\u5E76\u5728\u4ED6\u7684\u7814\u7A76\u4E2D\u5E94\u7528\u8FD9\u4E2A\u6982\u5FF5\uFF0C\u63A8\u52A8\u4E86\u8FD9\u4E2A\u6982\u5FF5\u7684\u4F7F\u7528\u3002"@zh . . "Jako stopslova se p\u0159i po\u010D\u00EDta\u010Dov\u00E9m zpracov\u00E1n\u00ED p\u0159irozen\u00E9ho jazyka ozna\u010Duj\u00ED slova, kter\u00E1 se v dan\u00E9m jazyce vyskytuj\u00ED \u010Dasto, ale nenesou \u017E\u00E1dnou v\u00FDznamovou informaci, maj\u00ED zpravidla pouze syntaktick\u00FD v\u00FDznam. Typicky se jedn\u00E1 o spojky, p\u0159edlo\u017Eky atp. Seznam takov\u00FDch slov (t\u00E9\u017E ozna\u010Dovan\u00FD jako negativn\u00ED slovn\u00EDk) pou\u017E\u00EDvaj\u00ED plnotextov\u00E9 vyhled\u00E1va\u010De a p\u0159i sestavov\u00E1n\u00ED indexu tato slova zcela ignoruj\u00ED, nebo\u0165 jsou pro vyhled\u00E1v\u00E1n\u00ED neu\u017Eite\u010Dn\u00E1. I p\u0159i jin\u00FDch form\u00E1ch po\u010D\u00EDta\u010Dov\u00E9ho zpracov\u00E1n\u00ED textov\u00FDch dokument\u016F se stopslova \u010Dasto vypou\u0161t\u011Bj\u00ED, nebo\u0165 tak dojde jak ke zmen\u0161en\u00ED zpracov\u00E1van\u00E9ho dokumentu, tak i ke zkr\u00E1cen\u00ED doby nutn\u00E9 pro jeho zpracov\u00E1n\u00ED. P\u0159i pou\u017Eit\u00ED lemmatizace m\u016F\u017Ee slovn\u00EDk obsahovat pouze z\u00E1kladn\u00ED tvary, v opa\u010Dn\u00E9m p\u0159\u00EDpad\u011B mus\u00ED obsahovat v\u0161echny pou\u017E\u00EDvan\u00E9 tvary stopslov. V \u010De\u0161tin\u011B mezi stopslova mohou b\u00FDt za\u0159azeny nap\u0159. spojky (a, aby, ale, ani, \u2026), p\u0159edlo\u017Eky (na, pro, u, \u2026), z\u00E1jmena (jej\u00ED, my, on), m\u00E1lov\u00FDznamov\u00E1 slovesa (b\u00FDt, m\u00EDt). V jin\u00FDch jazyc\u00EDch pat\u0159\u00ED mezi typick\u00E1 stopslova tak\u00E9 ur\u010Dit\u00E9 a neur\u010Dit\u00E9 \u010Dleny. V konkr\u00E9tn\u00EDch kontextech \u010Dasto mezi stopslova b\u00FDvaj\u00ED za\u0159azena slova v dan\u00E9m kontextu p\u0159\u00EDli\u0161 \u010Dast\u00E1 (nap\u0159. p\u0159i vyhled\u00E1v\u00E1n\u00ED na WWW tak jsou \u010Dasto ignorov\u00E1na slova jako www \u010Di com). Za vyn\u00E1lezce stopslov b\u00FDv\u00E1 pova\u017Eov\u00E1n ."@cs . . "Stop lista (ang. stop word) \u2013 lista s\u0142\u00F3w odrzucanych przez wyszukiwarki internetowe w celu zredukowania wielko\u015Bci zbior\u00F3w. S\u0105 to s\u0142owa o ma\u0142ym znaczeniu (sp\u00F3jniki: i, oraz, lub) oraz s\u0142owa popularne (mp3, sex), czyli niewp\u0142ywaj\u0105ce na identyfikacj\u0119 dokumentu. Listy takie mo\u017Cna utworzy\u0107 dla okre\u015Blonej dziedziny lub dla okre\u015Blonego j\u0119zyka. Istniej\u0105 stop-listy dla j\u0119zyka angielskiego, zawieraj\u0105ce ok. 450 s\u0142\u00F3w. Usuwanie wyraz\u00F3w nieznacz\u0105cych z tekstu mo\u017Ce si\u0119 odbywa\u0107 w nast\u0119puj\u0105cy spos\u00F3b:"@pl . . "Stop words are the words in a stop list (or stoplist or negative dictionary) which are filtered out (i.e. stopped) before or after processing of natural language data (text) because they are insignificant. There is no single universal list of stop words used by all natural language processing tools, nor any agreed upon rules for identifying stop words, and indeed not all tools even use such a list. Therefore, any group of words can be chosen as the stop words for a given purpose. The \"general trend in [information retrieval] systems over time has been from standard use of quite large stop lists (200\u2013300 terms) to very small stop lists (7\u201312 terms) to no stop list whatsoever\"."@en . "8555"^^ . . "Palavra vazia"@pt . . "Na computa\u00E7\u00E3o, uma palavra vazia (ou stop word, em ingl\u00EAs) \u00E9 uma palavra que \u00E9 removida antes ou ap\u00F3s o processamento de um texto em linguagem natural. N\u00E3o existe uma lista universal de palavras vazias usadas por todas as ferramentas de processamento de linguagem natural e nem todas ferramentas fazem uso de uma lista dessas palavras. Algumas ferramentas, inclusive, evitam remover as chamadas \"palavras vazias\" para dar suporte \u00E0 busca de senten\u00E7as."@pt . . . "Mot vide"@fr . . "Stoppord \u00E4r betydelsefattiga ord som f\u00F6rekommer i n\u00E4stan alla texter och d\u00E4rf\u00F6r ibland ignoreras/filtreras bort i texts\u00F6kning, indexering och andra spr\u00E5kteknologiska sammanhang. N\u00E5gra svenska exempel \u00E4r i, och, eller, men, en, ett och att."@sv . "\u0421\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430 \u0430\u0431\u043E \u0448\u0443\u043C\u043E\u0432\u0456 \u0441\u043B\u043E\u0432\u0430 \u2014 \u0442\u0435\u0440\u043C\u0456\u043D \u0437 \u0442\u0435\u043E\u0440\u0456\u0457 \u043F\u043E\u0448\u0443\u043A\u0443 \u0456\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0456\u0457 \u0437\u0430 \u043A\u043B\u044E\u0447\u043E\u0432\u0438\u043C\u0438 \u0441\u043B\u043E\u0432\u0430\u043C\u0438. \u0426\u0435 \u0441\u043B\u043E\u0432\u0430, \u044F\u043A\u0456 \u043D\u0435 \u043D\u0435\u0441\u0443\u0442\u044C \u0441\u043C\u0438\u0441\u043B\u043E\u0432\u043E\u0433\u043E \u043D\u0430\u0432\u0430\u043D\u0442\u0430\u0436\u0435\u043D\u043D\u044F, \u0442\u043E\u043C\u0443 \u0457\u0445 \u043A\u043E\u0440\u0438\u0441\u0442\u044C \u0442\u0430 \u0440\u043E\u043B\u044C \u0434\u043B\u044F \u043F\u043E\u0448\u0443\u043A\u0443 \u043D\u0435 \u0441\u0443\u0442\u0442\u0454\u0432\u0430."@uk . "Dins la inform\u00E0tica, les paraules buides o mots buits s\u00F3n llistes de paraules que es filtren durant el processament del llenguatge natural. No hi ha cap llista universal de paraules buides que s'utilitzi en totes les eines de processament de llenguatge natural, i de fet no totes les eines utilitzen una llista aix\u00ED. Fins i tot, algunes eines eviten eliminar les paraules buides per tal de permetre, per exemple, la cerca de frases. Qualsevol grup de paraules pot ser candidat a paraules buides per a cert prop\u00F2sit. Per a alguns motors de cerca, algunes de les m\u00E9s comunes s\u00F3n preposicions o articles com de, per, el, la o amb. Aix\u00F2 pot causar problemes a l'hora de cercar frases que els incloguin, particularment noms propis, com per exemple Charles de Gaulle, o l'Edat de pedra. Altres motors de cerca treuen alguns de les paraules m\u00E9s comunes \u2014 incloent-hi paraules l\u00E8xiques, com \u00ABser\u00BB \u2014 d'una cerca per tal de millorar el rendiment. Per la xarxa es poden trobar diverses llistes de paraules buides per al catal\u00E0"@ca . "Stoppwort"@de . . . . . . . "\u0421\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430, \u0438\u043B\u0438 \u0428\u0443\u043C\u043E\u0432\u044B\u0435 \u0441\u043B\u043E\u0432\u0430, \u2014 \u0442\u0435\u0440\u043C\u0438\u043D \u0438\u0437 \u0442\u0435\u043E\u0440\u0438\u0438 \u043F\u043E\u0438\u0441\u043A\u0430 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 \u043F\u043E \u043A\u043B\u044E\u0447\u0435\u0432\u044B\u043C \u0441\u043B\u043E\u0432\u0430\u043C. \u0421\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430 \u043C\u043E\u0433\u0443\u0442 \u0434\u0435\u043B\u0438\u0442\u044C\u0441\u044F \u043D\u0430 \u043E\u0431\u0449\u0438\u0435 \u0438 \u0437\u0430\u0432\u0438\u0441\u0438\u043C\u044B\u0435. \u041A \u043E\u0431\u0449\u0438\u043C \u043C\u043E\u0436\u043D\u043E \u043E\u0442\u043D\u0435\u0441\u0442\u0438 \u043F\u0440\u0435\u0434\u043B\u043E\u0433\u0438, \u0441\u0443\u0444\u0444\u0438\u043A\u0441\u044B, \u043F\u0440\u0438\u0447\u0430\u0441\u0442\u0438\u044F, \u043C\u0435\u0436\u0434\u043E\u043C\u0435\u0442\u0438\u044F, \u0446\u0438\u0444\u0440\u044B, \u0447\u0430\u0441\u0442\u0438\u0446\u044B \u0438 \u0442. \u043F. \u041E\u0431\u0449\u0438\u0435 \u0448\u0443\u043C\u043E\u0432\u044B\u0435 \u0441\u043B\u043E\u0432\u0430 \u0432\u0441\u0435\u0433\u0434\u0430 \u0438\u0441\u043A\u043B\u044E\u0447\u0430\u044E\u0442\u0441\u044F \u0438\u0437 \u043F\u043E\u0438\u0441\u043A\u043E\u0432\u043E\u0433\u043E \u0437\u0430\u043F\u0440\u043E\u0441\u0430 (\u0437\u0430 \u0438\u0441\u043A\u043B\u044E\u0447\u0435\u043D\u0438\u0435\u043C \u043F\u043E\u0438\u0441\u043A\u0430 \u043F\u043E \u0441\u0442\u0440\u043E\u0433\u043E\u043C\u0443 \u0441\u043E\u043E\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0438\u044E \u043F\u043E\u0438\u0441\u043A\u043E\u0432\u043E\u0439 \u0444\u0440\u0430\u0437\u044B), \u0442\u0430\u043A\u0436\u0435 \u043E\u043D\u0438 \u0438\u0433\u043D\u043E\u0440\u0438\u0440\u0443\u044E\u0442\u0441\u044F \u043F\u0440\u0438 \u043F\u043E\u0441\u0442\u0440\u043E\u0435\u043D\u0438\u0438 \u0438\u043D\u0432\u0435\u0440\u0442\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u043E\u0433\u043E \u0438\u043D\u0434\u0435\u043A\u0441\u0430. \u0421\u0447\u0438\u0442\u0430\u0435\u0442\u0441\u044F, \u0447\u0442\u043E \u043A\u0430\u0436\u0434\u043E\u0435 \u0438\u0437 \u043E\u0431\u0449\u0438\u0445 \u0441\u0442\u043E\u043F-\u0441\u043B\u043E\u0432 \u0435\u0441\u0442\u044C \u043F\u043E\u0447\u0442\u0438 \u0432\u043E \u0432\u0441\u0435\u0445 \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u0430\u0445 \u043A\u043E\u043B\u043B\u0435\u043A\u0446\u0438\u0438. \u0417\u0430\u0432\u0438\u0441\u0438\u043C\u044B\u0435 \u0441\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430 \u0437\u0430\u0432\u0438\u0441\u044F\u0442 \u043E\u0442 \u043F\u043E\u0438\u0441\u043A\u043E\u0432\u043E\u0439 \u0444\u0440\u0430\u0437\u044B. \u0418\u0434\u0435\u044F \u0437\u0430\u043A\u043B\u044E\u0447\u0430\u0435\u0442\u0441\u044F \u0432 \u0442\u043E\u043C, \u0447\u0442\u043E\u0431\u044B \u043F\u043E-\u0440\u0430\u0437\u043D\u043E\u043C\u0443 \u0443\u0447\u0438\u0442\u044B\u0432\u0430\u0442\u044C \u043E\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0438\u0435 \u043F\u0440\u043E\u0441\u0442\u043E \u0441\u043B\u043E\u0432 \u0438\u0437 \u0437\u0430\u043F\u0440\u043E\u0441\u0430 \u0438 \u0437\u0430\u0432\u0438\u0441\u0438\u043C\u044B\u0445 \u0441\u0442\u043E\u043F-\u0441\u043B\u043E\u0432 \u0438\u0437 \u0437\u0430\u043F\u0440\u043E\u0441\u0430 \u0432 \u043D\u0430\u0439\u0434\u0435\u043D\u043D\u043E\u043C \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u0435. \u041D\u0430\u043F\u0440\u0438\u043C\u0435\u0440, \u043F\u0440\u0438 \u043F\u043E\u0438\u0441\u043A\u0435 \u043F\u043E \u0437\u0430\u043F\u0440\u043E\u0441\u0443 \u041F\u0443\u0448\u043A\u0438\u043D \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440 \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447, \u0435\u0441\u0442\u044C \u0441\u043C\u044B\u0441\u043B \u043E\u0442\u043E\u0431\u0440\u0430\u0437\u0438\u0442\u044C \u0432\u0441\u0435 \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u044B \u0441\u043E\u0434\u0435\u0440\u0436\u0430\u0449\u0438\u0435: \n* \u041F\u0443\u0448\u043A\u0438\u043D, \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440, \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447 \n* \u041F\u0443\u0448\u043A\u0438\u043D, \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440 \n* \u041F\u0443\u0448\u043A\u0438\u043D, \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447 \n* \u041F\u0443\u0448\u043A\u0438\u043D \u041D\u043E \u0432\u0440\u044F\u0434 \u043B\u0438 \u0435\u0441\u0442\u044C \u0441\u043C\u044B\u0441\u043B \u043E\u0442\u043E\u0431\u0440\u0430\u0436\u0430\u0442\u044C \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u044B, \u0441\u043E\u0434\u0435\u0440\u0436\u0430\u0449\u0438\u0435 \u0442\u043E\u043B\u044C\u043A\u043E: \n* \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440, \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447 \n* \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440 \n* \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447 \u0422\u043E \u0435\u0441\u0442\u044C \u0432 \u0434\u0430\u043D\u043D\u043E\u043C \u0437\u0430\u043F\u0440\u043E\u0441\u0435 \u0448\u0443\u043C\u043E\u0432\u044B\u043C\u0438 \u0441\u043B\u043E\u0432\u0430\u043C\u0438 \u044F\u0432\u043B\u044F\u044E\u0442\u0441\u044F \u0410\u043B\u0435\u043A\u0441\u0430\u043D\u0434\u0440 \u0438 \u0421\u0435\u0440\u0433\u0435\u0435\u0432\u0438\u0447. \u0417\u0430\u0432\u0438\u0441\u0438\u043C\u044B\u0435 \u0441\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430 \u043E\u0442\u043B\u0438\u0447\u0430\u044E\u0442\u0441\u044F \u0442\u0435\u043C, \u0447\u0442\u043E \u0432 \u043F\u043E\u0438\u0441\u043A\u043E\u0432\u043E\u043C \u0437\u0430\u043F\u0440\u043E\u0441\u0435 \u0438\u0445 \u0441\u043B\u0435\u0434\u0443\u0435\u0442 \u0443\u0447\u0438\u0442\u044B\u0432\u0430\u0442\u044C \u0442\u043E\u043B\u044C\u043A\u043E \u043F\u0440\u0438 \u043D\u0430\u043B\u0438\u0447\u0438\u0438 \u0432 \u0438\u0441\u043A\u043E\u043C\u043E\u043C \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u0435 \u0437\u043D\u0430\u0447\u0438\u043C\u044B\u0445 \u043A\u043B\u044E\u0447\u0435\u0432\u044B\u0445 \u0441\u043B\u043E\u0432."@ru . . "\u0421\u0442\u043E\u043F-\u0441\u043B\u043E\u0432\u0430 \u0430\u0431\u043E \u0448\u0443\u043C\u043E\u0432\u0456 \u0441\u043B\u043E\u0432\u0430 \u2014 \u0442\u0435\u0440\u043C\u0456\u043D \u0437 \u0442\u0435\u043E\u0440\u0456\u0457 \u043F\u043E\u0448\u0443\u043A\u0443 \u0456\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0456\u0457 \u0437\u0430 \u043A\u043B\u044E\u0447\u043E\u0432\u0438\u043C\u0438 \u0441\u043B\u043E\u0432\u0430\u043C\u0438. \u0426\u0435 \u0441\u043B\u043E\u0432\u0430, \u044F\u043A\u0456 \u043D\u0435 \u043D\u0435\u0441\u0443\u0442\u044C \u0441\u043C\u0438\u0441\u043B\u043E\u0432\u043E\u0433\u043E \u043D\u0430\u0432\u0430\u043D\u0442\u0430\u0436\u0435\u043D\u043D\u044F, \u0442\u043E\u043C\u0443 \u0457\u0445 \u043A\u043E\u0440\u0438\u0441\u0442\u044C \u0442\u0430 \u0440\u043E\u043B\u044C \u0434\u043B\u044F \u043F\u043E\u0448\u0443\u043A\u0443 \u043D\u0435 \u0441\u0443\u0442\u0442\u0454\u0432\u0430."@uk . . "\u0428\u0443\u043C\u043E\u0432\u044B\u0435 \u0441\u043B\u043E\u0432\u0430"@ru . "En recherche d'information, un mot vide (ou stop word, en anglais) est un mot qui est tellement commun qu'il est inutile de l'indexer ou de l'utiliser dans une recherche. En fran\u00E7ais, des mots vides \u00E9vidents pourraient \u00EAtre \u00AB le \u00BB, \u00AB la \u00BB, \u00AB de \u00BB, \u00AB du \u00BB, \u00AB ce \u00BB\u2026"@fr . "Palabras vac\u00EDas es el nombre que reciben las palabras sin significado como art\u00EDculos, pronombres, preposiciones, etc. que son filtradas antes o despu\u00E9s del procesamiento de datos en lenguaje natural (texto). A Hans Peter Luhn, uno de los pioneros en recuperaci\u00F3n de informaci\u00F3n, se le atribuye la acu\u00F1aci\u00F3n de la locuci\u00F3n inglesa stop words y el uso del concepto en su dise\u00F1o. Est\u00E1 controlada por introducci\u00F3n humana y no autom\u00E1tica. No hay una lista definitiva de palabras vac\u00EDas que todas las herramientas de procesamiento de lenguajes naturales incorporen. No todas las herramientas de procesamiento de lenguajes naturales usan una lista de palabras vac\u00EDas. Algunas herramientas evitan usarlo espec\u00EDficamente para soportar b\u00FAsquedas por frase. El uso de un algoritmo de stemming puede reducir parte de la base l\u00F3gica o dependencia de una lista de palabras vac\u00EDas a filtrar. Las palabras vac\u00EDas pueden causar problemas al usar un motor de b\u00FAsqueda para buscar frases que las incluyen, especialmente en nombres como 'La verdad' o 'Nunca Jam\u00E1s'."@es . . .