DBpedia
| DBpedia | |
|---|---|
| Владелец | Лейпцигский университет и Университет Мангейма |
| Языки | Scala, Java, Virtuoso Server Pages |
| Коммерческий | нет |
| Сайт | http://dbpedia.org |
DBpedia — Краудсорсинговый проект, направленный на извлечение структурированной информации из данных, созданных в пределах проекта Википедия и публикации её в виде доступных под свободной лицензией наборов данных. Проект был отмечен Тимом Бернерсом-Ли как один из наиболее популярных примеров реализации концепции связанных данных.
Проект был начат группой добровольцев из Свободного университета Берлина и Лейпцигского университета, в сотрудничестве с фирмой OpenLink Software, первый набор данных опубликован в 2007 году. С 2012 года активным участником проекта является Университет Мангейма.
Базы данных
По состоянию базы данных DBpedia описывают более 6 миллионов понятий, из которых 5,2 миллионов классифицированы в соответствии с онтологией, в том числе 1,5 миллион персоналий, 810 тысяч географических объектов, 135 тысяч музыкальных альбомов, 106 тысяч фильмов, 20 тысяч видеоигр, 275 тысяч организаций, 201 тысяч таксонов и 5 тысяч заболеваний. DBpedia содержит 38 миллионов меток и аннотаций на 125 языках; 25,2 миллионов ссылок на изображения и 29,8 миллионов ссылок на внешние веб-страницы; 50 миллионов внешних ссылок на другие базы данных RDF-формата, 80,9 миллионов категорий Википедии. Проект использует Resource Description Framework (RDF) для представления извлечённой информации, базы состоят из более чем 9,5 миллиардов RDF-троек, из которых 1,3 миллиард взят из Английской Википедии и 5,0 миллиардов извлечены из разделов на других языках. Одна из проблем при извлечении информации из Википедии состоит в том, что одни и те же понятия могут быть выражены в шаблонах разными способами, например, понятие «место рождения» может быть сформулировано в английском языке как «birthplace» и как «placeofbirth». Из-за этой неоднозначности запрос проходит по обоим вариантам для получения более достоверного результата. Для облегчения поиска при сокращении количества синонимов был разработан специальный язык — DBpedia Mapping Language, а у пользователей DBpedia появилась возможность повышать качество извлечения данных с помощью сервиса Mapping.
Пример
DBpedia извлекает фактическую информацию со страниц Википедии, позволяя пользователям найти ответы на вопросы в ситуациях, когда требуемая информация находится в нескольких различных статьях Википедии. Например, чтобы найти все работы иллюстратора манги Tokyo Mew Mew, возможно выполнить следующий SPARQL-запрос:
PREFIX dbprop: <http://dbpedia.org/property/> PREFIX db: <http://dbpedia.org/resource/> SELECT?who?work?genre WHERE { db:Tokyo_Mew_Mew dbprop:illustrator?who.?work dbprop:author?who. OPTIONAL {?work dbprop:genre?genre }.
Примечания
- http://talis-podcasts.s3.amazonaws.com/twt20080207_TimBL.html
- https://web.archive.org/web/20130510134842/http://talis-podcasts.s3.amazonaws.com/twt20080207_TimBL.html
- Transcript: Sir Tim Berners-Lee Talks with Talis about the Semantic Web — http://talis-podcasts.s3.amazonaws.com/twt20080207_TimBL.html
- Источник — http://dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fdbpedia.org&should-sponge=&query=PREFIX+dbprop%3A+%3Chttp%3A%2F%2Fdbpedia.org%2Fproperty%2F%3E%0D%0APREFIX+db%3A+%3Chttp%3A%2F%2Fdbpedia.org%2Fresource%2F%3E%0D%0ASELECT+%3Fwho%2C+%3Fwork%2C+%3Fgenre+WHERE+%7B+%0D%0A+db%3ATokyo_Mew_Mew+dbprop%3Aauthor+%3Fwho+.%0D%0A+%3Fwork++dbprop%3Aauthor+%3Fwho+.%0D%0A+OPTIONAL+%7B+%3Fwork+dbprop%3Agenre+%3Fgenre+%7D+.%0D%0A%7D+%0D%0A&format=text%2Fhtml&debug=on&timeout=
- http://dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fdbpedia.org&should-sponge=&query=PREFIX+dbprop%3A+%3Chttp%3A%2F%2Fdbpedia.org%2Fproperty%2F%3E%0D%0APREFIX+db%3A+%3Chttp%3A%2F%2Fdbpedia.org%2Fresource%2F%3E%0D%0ASELECT+%3Fwho%2C+%3Fwork%2C+%3Fgenre+WHERE+%7B+%0D%0A+db%3ATokyo_Mew_Mew+dbprop%3Aauthor+%3Fwho+.%0D%0A+%3Fwork++dbprop%3Aauthor+%3Fwho+.%0D%0A+OPTIONAL+%7B+%3Fwork+dbprop%3Agenre+%3Fgenre+%7D+.%0D%0A%7D+%0D%0A&format=text%2Fhtml&debug=on&timeout=
- https://web.archive.org/web/20200729040200/http://dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fdbpedia.org&should-sponge=&query=PREFIX+dbprop%3A+%3Chttp%3A%2F%2Fdbpedia.org%2Fproperty%2F%3E%0D%0APREFIX+db%3A+%3Chttp%3A%2F%2Fdbpedia.org%2Fresource%2F%3E%0D%0ASELECT+%3Fwho%2C+%3Fwork%2C+%3Fgenre+WHERE+%7B+%0D%0A+db%3ATokyo_Mew_Mew+dbprop%3Aauthor+%3Fwho+.%0D%0A+%3Fwork++dbprop%3Aauthor+%3Fwho+.%0D%0A+OPTIONAL+%7B+%3Fwork+dbprop%3Agenre+%3Fgenre+%7D+.%0D%0A%7D+%0D%0A&format=text%2Fhtml&debug=on&timeout=
- http://dbpedia.org/sparql?default-graph-uri=http://dbpedia.org&should-sponge=&query=PREFIX+dbprop:+%3Chttp://dbpedia.org/property/%3E%0D%0APREFIX+db:+%3Chttp://dbpedia.org/resource/%3E%0D%0ASELECT+%3Fwho,+%3Fwork,+%3Fgenre+WHERE+{+%0D%0A+db:Tokyo_Mew_Mew+dbprop:author+%3Fwho+.%0D%0A+%3Fwork++dbprop:author+%3Fwho+.%0D%0A+OPTIONAL+{+%3Fwork+dbprop:genre+%3Fgenre+
- — на запрос на SPARQL к DBPedia