Beautiful Soup is a Python package for parsing HTML and XML documents (including having malformed markup, i.e. non-closed tags, so named after tag soup). It creates a parse tree for parsed pages that can be used to extract data from HTML, which is useful for web scraping. Beautiful Soup was started by Leonard Richardson, who continues to contribute to the project, and is additionally supported by Tidelift, a paid subscription to open-source maintenance.
Attributes | Values |
---|
rdf:type
| |
rdfs:label
| - Beautiful Soup (de)
- Beautiful Soup (HTML parser) (en)
- Beautiful Soup (es)
- Beautiful Soup (fr)
- 뷰티풀 수프 (HTML 파서) (ko)
- Beautiful Soup (uk)
- Beautiful Soup (zh)
|
rdfs:comment
| - Beautiful Soup ist eine freie Programmbibliothek für Screen Scraping. Mit der in Python geschriebenen Software lassen sich XML- und HTML-Dokumente parsen. Das Projekt wurde von Leonard Richardson gegründet und wird bis heute von ihm gepflegt. Eine frühere Version der Bibliothek, Beautiful Soup 3, funktionierte nur mit Python 2.x. Die aktuelle Version Beautiful Soup 4 kann mit Python 2.7 und 3 benutzt werden. Installiert werden kann es mit Hilfe von pip: pip install beautifulsoup4 Beautiful Soup selbst ist ein Frontend zu den grundlegenderen Parsern und . (de)
- Beautiful Soup is a Python package for parsing HTML and XML documents (including having malformed markup, i.e. non-closed tags, so named after tag soup). It creates a parse tree for parsed pages that can be used to extract data from HTML, which is useful for web scraping. Beautiful Soup was started by Leonard Richardson, who continues to contribute to the project, and is additionally supported by Tidelift, a paid subscription to open-source maintenance. (en)
- Beautiful Soup es una biblioteca de Python para analizar documentos HTML (incluyendo los que tienen un marcado incorrecto). Esta biblioteca crea un árbol con todos los elementos del documento y puede ser utilizado para extraer información. Por lo tanto, esta biblioteca es útil para realizar web scraping — extraer información de sitios web. Está disponible para Python 3. (es)
- Beautiful Soup (littéralement « Belle Soupe ») est une bibliothèque Python d'analyse syntaxique de documents HTML et XML créée par Leonard Richardson. Elle produit un arbre syntaxique qui peut être utilisé pour chercher des éléments ou les modifier. Lorsque le document HTML ou XML est mal formé (par exemple s'il manque des balises fermantes), Beautiful Soup propose une approche à base d'heuristiques afin de reconstituer l'arbre syntaxique sans générer d'erreurs. Cette approche est aussi utilisée par les navigateurs web modernes. Elle est disponible pour Python 2.7 et Python 3. (fr)
- Beautiful Soup是一个Python包,功能包括解析HTML、XML文档、修复含有未闭合标签等错误的文档(此种文档常被称为tag soup)。这个扩展包为待解析的页面建立一棵树,以便提取其中的数据,这在网络数据采集时非常有用。 该扩展包可用于Python 2.7(或以上版本)与Python 3。 (zh)
- Beautiful Soup — це модуль Python для аналізу HTML і XML документів. Він створює дерево аналізу для розібраних сторінок, яке можна використовувати для вилучення даних з HTML, що часто використовують для вебскрапінгу. Beautiful Soup був започаткований Леонардом Річардсоном, який і продовжує робити свій внесок , проект додатково підтримується завдяки Tidelift, платній підписці на підтримку проектів з відкритим кодом. Модуль доступний для Python 2.7 і Python 3. (uk)
|
foaf:name
| |
foaf:homepage
| |
name
| |
dcterms:subject
| |
Wikipage page ID
| |
Wikipage revision ID
| |
Link from a Wikipage to another Wikipage
| |
Link from a Wikipage to an external page
| |
sameAs
| |
dbp:wikiPageUsesTemplate
| |
author
| |
genre
| - HTML parser library, Web scraping (en)
|
license
| |
platform
| |
programming language
| |
title
| |
website
| |
has abstract
| - Beautiful Soup ist eine freie Programmbibliothek für Screen Scraping. Mit der in Python geschriebenen Software lassen sich XML- und HTML-Dokumente parsen. Das Projekt wurde von Leonard Richardson gegründet und wird bis heute von ihm gepflegt. Eine frühere Version der Bibliothek, Beautiful Soup 3, funktionierte nur mit Python 2.x. Die aktuelle Version Beautiful Soup 4 kann mit Python 2.7 und 3 benutzt werden. Installiert werden kann es mit Hilfe von pip: pip install beautifulsoup4 Beautiful Soup selbst ist ein Frontend zu den grundlegenderen Parsern und . (de)
- Beautiful Soup is a Python package for parsing HTML and XML documents (including having malformed markup, i.e. non-closed tags, so named after tag soup). It creates a parse tree for parsed pages that can be used to extract data from HTML, which is useful for web scraping. Beautiful Soup was started by Leonard Richardson, who continues to contribute to the project, and is additionally supported by Tidelift, a paid subscription to open-source maintenance. (en)
- Beautiful Soup es una biblioteca de Python para analizar documentos HTML (incluyendo los que tienen un marcado incorrecto). Esta biblioteca crea un árbol con todos los elementos del documento y puede ser utilizado para extraer información. Por lo tanto, esta biblioteca es útil para realizar web scraping — extraer información de sitios web. Está disponible para Python 3. (es)
- Beautiful Soup (littéralement « Belle Soupe ») est une bibliothèque Python d'analyse syntaxique de documents HTML et XML créée par Leonard Richardson. Elle produit un arbre syntaxique qui peut être utilisé pour chercher des éléments ou les modifier. Lorsque le document HTML ou XML est mal formé (par exemple s'il manque des balises fermantes), Beautiful Soup propose une approche à base d'heuristiques afin de reconstituer l'arbre syntaxique sans générer d'erreurs. Cette approche est aussi utilisée par les navigateurs web modernes. Elle est disponible pour Python 2.7 et Python 3. (fr)
- 뷰티풀 수프(Beautiful Soup)는 HTML과 XML 문서들의 구문을 분석하기 위한 파이썬 패키지이다. HTML로부터 데이터를 추출하기 위해 사용할 수 있는 파싱된 페이지의 파스 트리를 만드는데, 이는 에 유용하다. 뷰티풀 수프는 이 프로젝트를 계속 기여하고 있는 Leonard Richardson이 시작하였다. 추가적인 지원은 오픈 소스 유지보수를 위한 유료 구독형인 Tidelift의 지원을 받는다. 파이썬 2.7과 파이썬 3용으로 사용 가능하다. (ko)
- Beautiful Soup — це модуль Python для аналізу HTML і XML документів. Він створює дерево аналізу для розібраних сторінок, яке можна використовувати для вилучення даних з HTML, що часто використовують для вебскрапінгу. Beautiful Soup був започаткований Леонардом Річардсоном, який і продовжує робити свій внесок , проект додатково підтримується завдяки Tidelift, платній підписці на підтримку проектів з відкритим кодом. Модуль доступний для Python 2.7 і Python 3. #!/usr/bin/env python3# Anchor extraction from HTML documentfrom bs4 import BeautifulSoupfrom urllib.request import urlopenwith urlopen('https://en.wikipedia.org/wiki/Main_Page') as response: soup = BeautifulSoup(response, 'html.parser') for anchor in soup.find_all('a'): print(anchor.get('href', '/')) (uk)
- Beautiful Soup是一个Python包,功能包括解析HTML、XML文档、修复含有未闭合标签等错误的文档(此种文档常被称为tag soup)。这个扩展包为待解析的页面建立一棵树,以便提取其中的数据,这在网络数据采集时非常有用。 该扩展包可用于Python 2.7(或以上版本)与Python 3。 (zh)
|
prov:wasDerivedFrom
| |
page length (characters) of wiki page
| |
computing platform
| |
genre
| |
license
| |
programming language
| |
foaf:isPrimaryTopicOf
| |
is Link from a Wikipage to another Wikipage
of | |
is Wikipage redirect
of | |