This HTML5 document contains 89 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

Namespace Prefixes

PrefixIRI
dctermshttp://purl.org/dc/terms/
dbohttp://dbpedia.org/ontology/
foafhttp://xmlns.com/foaf/0.1/
n27https://global.dbpedia.org/id/
yagohttp://dbpedia.org/class/yago/
dbpedia-ruhttp://ru.dbpedia.org/resource/
dbthttp://dbpedia.org/resource/Template:
n6http://www.nltk.org/api/
dbpedia-ukhttp://uk.dbpedia.org/resource/
rdfshttp://www.w3.org/2000/01/rdf-schema#
freebasehttp://rdf.freebase.com/ns/
n10https://www.cs.cmu.edu/afs/cs/Web/People/wcohen/postscript/
dbpedia-pthttp://pt.dbpedia.org/resource/
n23https://web.archive.org/web/19990822155334/http:/www.census.gov/geo/msb/stand/
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#
n14https://files.eric.ed.gov/fulltext/
dbpedia-arhttp://ar.dbpedia.org/resource/
owlhttp://www.w3.org/2002/07/owl#
dbpedia-frhttp://fr.dbpedia.org/resource/
wikipedia-enhttp://en.wikipedia.org/wiki/
dbphttp://dbpedia.org/property/
dbchttp://dbpedia.org/resource/Category:
provhttp://www.w3.org/ns/prov#
dbpedia-thhttp://th.dbpedia.org/resource/
xsdhhttp://www.w3.org/2001/XMLSchema#
n13https://www.census.gov/content/dam/Census/library/working-papers/2006/adrm/
wikidatahttp://www.wikidata.org/entity/
goldhttp://purl.org/linguistics/gold/
dbrhttp://dbpedia.org/resource/
dbpedia-jahttp://ja.dbpedia.org/resource/

Statements

Subject Item
dbr:Jaro–Winkler_distance
rdf:type
yago:Algorithm105847438 yago:Action100037396 yago:YagoPermanentlyLocatedEntity yago:Event100029378 yago:PsychologicalFeature100023100 yago:Decision100162632 yago:WikicatAlgorithmsOnStrings yago:Act100030358 yago:Maneuver100168237 yago:Abstraction100002137 yago:Move100165942 yago:Measure100174412 yago:Choice100161243 yago:WikicatStringSimilarityMeasures yago:Activity100407535 yago:Procedure101023820 yago:Rule105846932 dbo:Software
rdfs:label
Подібність Джаро — Вінклера Distance de Jaro-Winkler ジャロ・ウィンクラー距離 مسافة جارو وينكلر Distância de Jaro-Winkler Сходство Джаро — Винклера Jaro–Winkler distance
rdfs:comment
ジャロ・ウィンクラー距離(ジャロ・ウィンクラーきょり、英: Jaro–Winkler distance)とは2つの文字列の類似度の指標である。1989年にマシュー・A・ジャロによって提案されたジャロ距離の変種として1990年にウィリアム・E・ウィンクラーが提案したものである。ジャロ・ウィンクラー距離が小さいほど、2つの文字列は似ている。 ジャロ・ウィンクラー距離は、文字列の先頭部分(接頭辞)が一致している場合により類似度が高いと判別されるよう、ジャロ距離を変形したものである。ジャロ・ウィンクラー距離は、ジャロ距離を元に、(ある最大値を持つ)一致する接頭辞の長さ と、ジャロ・ウィンクラー距離が 0 以上 1 以下の範囲で定義されるよう調整されたスケール因子 を用いて計算される。 ジャロ・ウィンクラー距離 は完全一致する文字列に対して 0、完全に異なる文字列に対して 1 となる。ただし原論文では距離ではなく類似度 を定義しており、1 が完全一致、0 が完全不一致となるようになっている(すなわち )。 慣習的に「距離」と呼ばれるが、ジャロ・ウィンクラー距離は三角不等式を満たさないため数学的な意味での距離ではない。 La distance de Jaro-Winkler mesure la similarité entre deux chaînes de caractères. Il s'agit d'une variante proposée en 1999 par , découlant de la distance de Jaro (1989, ) qui est principalement utilisée dans la détection de doublons. Le résultat est normalisé de façon à avoir une mesure entre 0 et 1, donc 1 représente l'absence de similarité et 0, l'égalité des chaines comparées. Cette mesure est particulièrement adaptée au traitement de chaînes courtes comme des noms ou des mots de passe. In computer science and statistics, the Jaro–Winkler distance is a string metric measuring an edit distance between two sequences. It is a variant proposed in 1990 by of the Jaro distance metric (1989, ). The Jaro–Winkler distance uses a prefix scale which gives more favourable ratings to strings that match from the beginning for a set prefix length . Although often referred to as a distance metric, the Jaro–Winkler distance is not a metric in the mathematical sense of that term because it does not obey the triangle inequality. В области информатики и статистики сходство Джаро — Винклера представляет собой меру схожести строк для измерения расстояния между двумя последовательностями символов. Это вариант, который в 1999 году предложил Уильям Э. Винклер (William E. Winkler) на основе расстояния Джаро (1989, Мэтью А. Джаро, Matthew A. Jaro). Неформально, расстояние Джаро между двумя словами — это минимальное число односимвольных преобразований, которое необходимо для того, чтобы изменить одно слово в другое. في علم الحاسوب والإحصاءات، فإن مسافة جارو وينكلر هي مقياس سلسلة يقيس مسافة التعديل بين سلسلتين. هو البديل الذي اقترحه في عام 1990 من قبل وليام إي وينكلر من مقياس مسافة جارو (1989، ماثيو أ. جارو). تستخدم مسافة جارو وينكلر مقياس البادئة الذي يعطي تقييمات أكثر ملاءمة للسلاسل التي تتطابق منذ البداية مع طول البادئة المحدد . كلما قلت المسافة بين جارو وينكلر عن السلسلتين، كلما كانت الخيوط أكثر تشابهًا. يتم تطبيع النتيجة بحيث يعني 0 تطابقًا تامًا و1 يعني عدم وجود تشابه. تشابه جارو وينكلر هو الانعكاس، (1 - مسافة جارو وينكلر). A métrica de distância Jaro-Winkler é a medida da similaridade entre duas strings. É uma variação da métrica Jaro distance . A métrica Jaro distance estabelece que dadas duas strings and , sua distância é: onde: * é o número de correlações entre caracteres; * e são os tamanhos de e , respectivamente; * é o número de transposições. В інформатиці та статистиці подібність Джаро — Вінклера — це , що вимірює між двома послідовностями. Є модифікацією метрики подібності Джаро (1989, ), запропонованою у 1990 році . Відстань Джаро–Вінклера використовує оцінку довжини префікса , що дає більш сприятливі оцінки рядкам, що з самого початку відповідають заданій довжині префікса . Чим менша відстань Джаро–Вінклера для двох рядків, тим більш подібними є рядки. Оцінка нормується таким чином, що 1 означає точну відповідність, а 0 означає відсутність будь-якої подібності. Подібність Джаро — Вінклера дає протилежні результати.
dcterms:subject
dbc:String_metrics
dbo:wikiPageID
6782835
dbo:wikiPageRevisionID
1124567491
dbo:wikiPageWikiLink
dbr:Record_linkage dbr:Hamming_distance dbc:String_metrics dbr:Statistics dbr:Levenshtein_distance dbr:String_metric dbr:Damerau–Levenshtein_distance dbr:Scaling_factor dbr:William_E._Winkler dbr:Smith–Waterman_algorithm dbr:Computer_science dbr:Longest_common_subsequence_problem dbr:Prefix dbr:Matthew_A._Jaro dbr:Edit_distance dbr:Sequence_alignment dbr:Metric_(mathematics) dbr:Census dbr:Transposition_(mathematics) dbr:Natural_Language_Toolkit dbr:Triangle_inequality
dbo:wikiPageExternalLink
n6:nltk.metrics.distance.html n10:kdd-2003-match-ws.pdf n13:rrs2006-02.pdf n14:ED325505.pdf n23:strcmp.c
owl:sameAs
dbpedia-pt:Distância_de_Jaro-Winkler dbpedia-ja:ジャロ・ウィンクラー距離 dbpedia-ru:Сходство_Джаро_—_Винклера wikidata:Q3030677 freebase:m.0gnnzq dbpedia-uk:Подібність_Джаро_—_Вінклера dbpedia-th:ระยะทางจาโร-วิงเคลอร์ n27:2ojZx dbpedia-ar:مسافة_جارو_وينكلر dbpedia-fr:Distance_de_Jaro-Winkler
dbp:wikiPageUsesTemplate
dbt:Main dbt:! dbt:Cite_journal dbt:Short_description dbt:About dbt:Strings dbt:Reflist
dbo:abstract
في علم الحاسوب والإحصاءات، فإن مسافة جارو وينكلر هي مقياس سلسلة يقيس مسافة التعديل بين سلسلتين. هو البديل الذي اقترحه في عام 1990 من قبل وليام إي وينكلر من مقياس مسافة جارو (1989، ماثيو أ. جارو). تستخدم مسافة جارو وينكلر مقياس البادئة الذي يعطي تقييمات أكثر ملاءمة للسلاسل التي تتطابق منذ البداية مع طول البادئة المحدد . كلما قلت المسافة بين جارو وينكلر عن السلسلتين، كلما كانت الخيوط أكثر تشابهًا. يتم تطبيع النتيجة بحيث يعني 0 تطابقًا تامًا و1 يعني عدم وجود تشابه. تشابه جارو وينكلر هو الانعكاس، (1 - مسافة جارو وينكلر). على الرغم من أنه غالبًا ما يشار إليه بمقياس دالة المسافة، فإن مسافة جارو وينكلر ليست مقياسًا بالمعنى الرياضي لهذا المصطلح لأنها لا تطيع متباينة المثلث. В области информатики и статистики сходство Джаро — Винклера представляет собой меру схожести строк для измерения расстояния между двумя последовательностями символов. Это вариант, который в 1999 году предложил Уильям Э. Винклер (William E. Winkler) на основе расстояния Джаро (1989, Мэтью А. Джаро, Matthew A. Jaro). Неформально, расстояние Джаро между двумя словами — это минимальное число односимвольных преобразований, которое необходимо для того, чтобы изменить одно слово в другое. Чем меньше расстояние Джаро — Винклера для двух строк, тем больше сходства имеют эти строки друг с другом. Результат нормируется, так что означает отсутствие сходства, а — точное совпадение. Сходство Джаро — Винклера равно . В інформатиці та статистиці подібність Джаро — Вінклера — це , що вимірює між двома послідовностями. Є модифікацією метрики подібності Джаро (1989, ), запропонованою у 1990 році . Відстань Джаро–Вінклера використовує оцінку довжини префікса , що дає більш сприятливі оцінки рядкам, що з самого початку відповідають заданій довжині префікса . Чим менша відстань Джаро–Вінклера для двох рядків, тим більш подібними є рядки. Оцінка нормується таким чином, що 1 означає точну відповідність, а 0 означає відсутність будь-якої подібності. Подібність Джаро — Вінклера дає протилежні результати. Хоча її часто називають метрикою відстані, відстань Яро–Вінклера не є метрикою в математичному розумінні, оскільки вона не виконує нерівність трикутника. A métrica de distância Jaro-Winkler é a medida da similaridade entre duas strings. É uma variação da métrica Jaro distance . A métrica Jaro distance estabelece que dadas duas strings and , sua distância é: onde: * é o número de correlações entre caracteres; * e são os tamanhos de e , respectivamente; * é o número de transposições. In computer science and statistics, the Jaro–Winkler distance is a string metric measuring an edit distance between two sequences. It is a variant proposed in 1990 by of the Jaro distance metric (1989, ). The Jaro–Winkler distance uses a prefix scale which gives more favourable ratings to strings that match from the beginning for a set prefix length . The higher the Jaro–Winkler distance for two strings is, the less similar the strings are. The score is normalized such that 0 means an exact match and 1 means there is no similarity. The original paper actually defined the metric in terms of similarity, so the distance is defined as the inversion of that value (distance = 1 − similarity). Although often referred to as a distance metric, the Jaro–Winkler distance is not a metric in the mathematical sense of that term because it does not obey the triangle inequality. ジャロ・ウィンクラー距離(ジャロ・ウィンクラーきょり、英: Jaro–Winkler distance)とは2つの文字列の類似度の指標である。1989年にマシュー・A・ジャロによって提案されたジャロ距離の変種として1990年にウィリアム・E・ウィンクラーが提案したものである。ジャロ・ウィンクラー距離が小さいほど、2つの文字列は似ている。 ジャロ・ウィンクラー距離は、文字列の先頭部分(接頭辞)が一致している場合により類似度が高いと判別されるよう、ジャロ距離を変形したものである。ジャロ・ウィンクラー距離は、ジャロ距離を元に、(ある最大値を持つ)一致する接頭辞の長さ と、ジャロ・ウィンクラー距離が 0 以上 1 以下の範囲で定義されるよう調整されたスケール因子 を用いて計算される。 ジャロ・ウィンクラー距離 は完全一致する文字列に対して 0、完全に異なる文字列に対して 1 となる。ただし原論文では距離ではなく類似度 を定義しており、1 が完全一致、0 が完全不一致となるようになっている(すなわち )。 慣習的に「距離」と呼ばれるが、ジャロ・ウィンクラー距離は三角不等式を満たさないため数学的な意味での距離ではない。 La distance de Jaro-Winkler mesure la similarité entre deux chaînes de caractères. Il s'agit d'une variante proposée en 1999 par , découlant de la distance de Jaro (1989, ) qui est principalement utilisée dans la détection de doublons. Le résultat est normalisé de façon à avoir une mesure entre 0 et 1, donc 1 représente l'absence de similarité et 0, l'égalité des chaines comparées. Cette mesure est particulièrement adaptée au traitement de chaînes courtes comme des noms ou des mots de passe.
gold:hypernym
dbr:Measure
prov:wasDerivedFrom
wikipedia-en:Jaro–Winkler_distance?oldid=1124567491&ns=0
dbo:wikiPageLength
8078
foaf:isPrimaryTopicOf
wikipedia-en:Jaro–Winkler_distance