Лутай А.В. 2023-08-15
- API и SPARQL интерфейсы
- Материалы на русском языке
- Типовые задачи – сведения о
статье
- Информация о статье в Wikipedia
- Другие названия объекта статьи
- Все языковые версии статьи в Wikipedia
- Извлечь категории статьи
- 📌 Получение изображений из статьи
- Извлечь разделы статьи в Wikipedia
- Получить Wikidata ID по названию статьи в Wikipedia
- Найти страницы Wikipedia по Wikidata ID
- Цитировать статью Wikipedia в формате bibtex
- Типовые задачи – поиск статей и изображений
- Типовые задачи – правки и просмотры
- Типовые задачи – ссылки и цитирования
- “Наукометрия” в Wikidata
- Все российские журналы в Wikidata
- Количество статей в Wikidata в российских журналах
- Извлечение источников заданного атрибута
- Поиск журнала по ISSN в Wikidata и импорт сведений
- Статьи из выбранного журнала и цитирующие их журналы
- Список авторов журнала, у которых указан ORCID
- Женщины-ученые с наградами, цитировавшие выбранный журнал
- Российские ученые, имеющие ORCID и статью в русскоязычной Wikipedia
- Исследователи младше 30 лет, имеющие статью в англоязычной Wikipedia
- Исследователи, цитировавшие статьи из журнала со списком цитирующих и процитированных статей
- Перечень организаций, сотрудники которых цитировали статьи из выбранного журнала
- Статьи из журнала и процитировавшие их организации и страны
- Карта университетов Москвы, расположенных в <=500 метрах от станций метро
- Практика – как вносить сведения в Wikidata?
- 📌 Приложение 1. Русскоязычные “вики”
- 📌 Приложение 2. Другие русскоязычные проекты
- 📌 Приложение 3. Вики-проекты на других языках
- 📌 Приложение 4. Сервисы Wikimedia
- 📌 Приложение 5. Wiki-сервисы не на MediaWiki
- 📌 Будущие проекты MediaWiki
- Обратная связь
Цель этого сборника примеров – обратить внимание на уникальные возможности API- и SPARQL-интерефейсов сервисов Wikipedia и Wikidata.
Большая часть примеров тематически связана с академическими журналами, поскольку первоначальная версия материала была подготовлена для доклада на 11-ой Международной научно-практической конференции Ассоциации научных редакторов и издателей (АНРИ) «Научное издание международного уровня – 2023: достижения, реалии, перспективы» (23-26 мая, 2023 г.).
Приведенные примеры демонстрируют лишь малую часть доступных возможностей – акцент сделан на запросах, которые могут быть выполнены в веб-браузере пользователями, не имеющими опыта написания скриптов на языках программирования.
Материал будет существовать в виде README страницы и продолжать пополняться новыми примерами до тех пор пока автор (или контрибьюторы) не решат, что другой формат будет удобнее.
Приложения ниже включают примеры использования API русскоязычных вики, развернутых на базе ПО MediaWiki.
Как автор настоящего материала, заявляю следующее:
-
упоминание любого из ресурсов не является рекламой и не является моей рекомендацией использовать ресурс
-
настоящий материал не должен рассматриваться как моё согласие/одобрение/неодобрение по отношению к любым утверждениям и точкам зрения, опубликованным на перечисленных ресурсах
-
если Вы склонны думать, что какие-то материалы из перечисленных ресурсов являются порочащими, ложными, оскорбительными или нарушающими чьи-то права, обязательно свяжитесь с правообладателем ресурса, правоохранителями, правозащитниками и т.п.
Продолжая читать, Вы принимаете на себя полную ответственность за все Ваши действия (в т.ч. мыслепреступления), к которым может привести прочтение материала ниже, а также за все связанные с этим последствия.
Обозначения
📘 – гиперссылка на веб-страницу с подробной спецификацией или руководство.
📌 – недавно добавленные примеры (подробную историю изменений можно всегда увидеть в истории.
🔝 – кнопка для возвращения к оглавлению страницы.
🎨 – есть на что посмотреть.
Остальные emoji могут интепретироваться произвольно.
MediaWiki Action API (/api.php) предоставляет пользователям возможности аутентификации, получения сведений о страницах, пользователях, совершенных правках, а также вносить изменений, обращаться к персональным настройкам и использовать специальные права.
Перелистывание результатов ⏩
Если запрос к API не срабатывает, рекомендуется добавлять в конец
запроса &origin=*
.
MediaWiki REST API (/rest.php) позволяет взаимодействовать с MediaWiki путем отправки HTTP запросов к rest.php адресам URL. Этот API можно использовать для скриптов для поиска и сбора сведений из страниц и иллюстраций, а также изучения истории правок.
Wikimedia REST API (/api/rest) предоставляет доступ к контенту Wikimedia сервисов и метаданным в машиночитаемых форматах. API интегрирован с Wikimedia’s globally distributed caching infrastructure и создан для обеспечения работы приложений, запрашивающих большие объемы данных.
REST API вместе с документацией доступны для большинства главных проектов Wikimedia по адресу /api/rest_v1/.
Для всех проектов Wikimedia:
Для англоязычной Wikipedia:
📌 Каталог новых REST API от Wikimedia (в стадии разработки):
Стоит обратить внимание на:
-
Core REST API https://api.wikimedia.org/wiki/Core_REST_API
-
Page Description API https://api.wikimedia.org/wiki/Page_Description_API
Wikidata работает на ПО Wikibase, поэтому API более правильно называть Wikibase REST API.
Примеры SPARQL-запросов в основной части будут сопровождаться
гиперссылками, открывающими запрос в интерфейсе Wikidata
Query Service. Для выполнения запроса в
интерфейсе не забудьте нажать кнопку
Их также можно отправлять программными средствами с помощью R: WikidataR или 🐍 : пакет Wikidata, см. также другие примеры).
-
Руководство по использованию SPARQL (частично на русском языке)
-
https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries/examples
-
https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries/examples/advanced
-
Список атрибутов. Академические издатели найдут атрибуты для описания журналов, статей и авторов в разделах research, science, unique identifier, work.
Базовые сведения:
-
Введение в Википедию – Козловский С.А., Цапенко А.М., Жуков Д.А., Медейко В.В., Рожков Д.В. Введение в Википедию : учебно-методическое пособие. / Под общ. ред. С. А. Козловского. — М.: Викимедиа РУ, 2022. — 246 с. ISBN 978-5-99017-536-5
Популярным языком:
-
Статья “Сервис Викиданные для научных журналов”, (2023).
-
Статья “О профилях организаций в Wikidata”, (2022).
-
Семинар “Работа с метаданными” (12.10.2022) от Наукометрического центра ВШЭ. Видео YouTube, про Викиданные с 25-ой минуты.
Для тех, кто готов пойти дальше: 🏆
MediaWiki REST API
Возвращает json-структуру, содержащую идентификатор статьи, сведения о последней правке и элемент source, в котором находится полный текст страницы в формате вики-разметки (что такое вики-разметка?).
MediaWiki Action API
По сравнению с предыдущим запросом возвращает более детальную json-структуру, из которой легко извлечь текст, языковые версии, категории, ссылки на страницы Wikipedia, ссылка на внешние страницы, перечень изображений, секций, шаблонов, интер-вики ссылок и идентификатор элемента Викиданных, соответствующего статье (wikibase_item в разделе properties).
https://en.wikipedia.org/w/api.php?action=parse&page=The%20BMJ&format=json
Wikimedia REST API
Возвращает не содержание статьи, а сведения о ней – пространство имён (namespace), название, идентификатор элемента Викиданных, ссылки на основную иллюстрацию статьи, сведения о последней правке (временная отметка, ID), краткое описание в формате простого текста и HTML.
Иногда предмету статьи могут соответствовать несколько названий – в приведенном ниже примере запрос возвращает варианты названий журнала BMJ.
https://en.wikipedia.org/w/api.php?action=query&prop=pageterms&titles=The%20BMJ&format=json
Запросы ниже позволяют получить перечень всех языковых версий заданной статьи.
MediaWiki REST API
возвращает только названия страниц
https://en.wikipedia.org/w/rest.php/v1/page/The_Lancet/links/language
MediaWiki Action API
возвращает pageid для страниц объекта и полные URL на страницы языковых версий
Статьи Wikipedia нередко бывают отнесены к различным категориям.
MediaWiki Action API
Приведенный ниже запрос возвращает перечень категорий, к которым отнесена статья о журнале The BMJ в англоязычной Википедии.
https://en.wikipedia.org/w/api.php?action=parse&page=The%20BMJ&prop=categories&format=json
Одна из них – “BMJ Group academic journals”.
📌 Запрос ниже возвращает перечень статей, также отнесенных к категории BMJ Group academic journals (подробнее).
MediaWiki Action API
Запрос ниже использует ранее рассмотренный механизм запроса к API https://www.mediawiki.org/wiki/API:Query для получения списка всех иллюстраций из страниц русскоязычной Википедии, содержащих строку “аграрный университет”:
Расширение перечня параметров позволяет получить более широкий набор полей:
- inprop=url возвращает URL на найденные статьи
- piprop=name|original|thumbnail&pithumbsize=300 возвращает сведения (в т.ч. URL) на оригинальное изображение статьи (pageimage) и его иконке (thumbnail), автоматически увеличенной до 300 px в ширину (см. query+pageimages)
Более полные сведения об изображениях внутри статьи (images) можно получить запросами, используя имена файлов (в примере ниже запрос для получения сведений о файле File:Moscow_08-2012_Petrovsko-Razumovskoe_img01.jpg):
MediaWiki Action API
Возвращает перечень разделов страницы Wikipedia, их размер, порядковые номера и названия внутренних ссылок.
https://en.wikipedia.org/w/api.php?action=parse&format=json&page=The%20BMJ&prop=sections
Получив сведения из запроса выше, можно извлечь отдельные разделы в форматах wikitext или parsetree
В отличие от Википедии, в которой не всякому академическому журналу полагается собственная статья (см. статью Wikipedia:Notability_(academic_journals)), создание и редактирование карточки журнала в Викиданных доступно каждому зарегистрированному пользователю (при условии соблюдения правил). Типы объектов и отношений в Wikidata предлагают издателю широкий выбор инструментов для описания журнала – истории его трансформаций, отношений с юридическими и физическими лицами, отражения опубликованных статей и т.д. (подробнее в статье Сервис Викиланные для научных журналов).
Запросы ниже позволяют для перечня статей Википедии собрать идентификаторы Викиданных.
MediaWiki Action API
возвращает Wikibase ID (aka Wikidata ID) и wikibase-shortdesc (если есть)
https://ru.wikipedia.org/w/api.php?action=query&prop=pageprops&format=json&titles=Криосфера_Земли
Wikimedia REST API
возвращает информацию о странице, в которой есть поле wikibase_item
https://ru.wikipedia.org/api/rest_v1/page/summary/Криосфера_Земли
Wikidata REST API
возвращает все запрошенные элементы Wikidata. При запросе русскоязычной страницы необходимо заменить enwiki на ruwiki, можно также получать заголовки на нескольких языках (en|ru).
Wikidata SPARQL
SELECT ?lemma ?item WHERE {
VALUES ?lemma {"Успехи химии"@ru}
?sitelink schema:about ?item;
schema:isPartOf <https://ru.wikipedia.org/>;
schema:name ?lemma.
}
отправить через Wikidata Query Service
Нередко можно столкнуться и с обратной задачей – из какого-нибудь реестра собраны идентификаторы Wikidata (например, OpenAlex или ROR) и необходимо собрать список существующих статей в Википедии.
Wikidata REST API
https://www.wikidata.org/w/api.php?action=wbgetentities&format=xml&props=sitelinks&ids=Q3453517
Добавление в запрос выражения вида &sitefilter=enwiki
возвращает
английскоязычную версию статьи (ruwiki – русскоязычную).
Wikidata SPARQL
SELECT DISTINCT ?article WHERE {
VALUES ?item {wd:Q3453517}
?article schema:about ?item;
schema:isPartOf <https://ru.wikipedia.org/>
}
отправить через Wikidata Query Service
Wikimedia REST API
Сервис поддерживает также формат zotero и несколько других (mediawiki, wikibase). Цитируемый URL включает параметр oldid – идентификатор последней правки на момент цитирования!
MediaWiki Action API
В MediaWiki Action API есть 2 варианта поиска по тексту :
(а) https://www.mediawiki.org/wiki/API:Search – выполняет поиск строки, указанной в параметре (srcsearch=) по названию статьи (srsearch=intitle:), тексту статьи (srsearch=text:), или начальным символам названия статьи (srsearch=prefix:)
https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch=nejm&utf8=&format=json
Результаты можно выводить с дополнительной информацией, если использовать generator, в этом случае параметры будут содержать префикс g (например: gsrsearch вместо search). В примере ниже к результатам поиска статей, содержащих в названии строку Chemical journal добавлены сведения (prop=) о статьи, категориях, внутренних и внешних ссылках.
(б) https://www.mediawiki.org/wiki/API:Opensearch – выполняет поиск строки, указанной в параметре (search=) по тексту статьи в формате Open Search. Параметр profile позволяет варьировать строгость запроса от strict до fuzzy (по умолчанию – поисковик сам выбирает формат поиска).
Возвращает результаты в виде 3 списков:
- названия страниц
- пустой блок, где должны были быть descriptions,
- URL страниц
Альтернативный синтаксис поиска по префиксу с поддержкой неточного (fuzzy) поиска:
Wikimedia Core REST API
Новый Core REST API позволяет проводить текстовый поиск:
https://api.wikimedia.org/core/v1/wikipedia/ru/search/title?q=институт физической химии&limit=10
https://api.wikimedia.org/core/v1/wikipedia/en/search/page?q=the%20lancet&limit=10
Поиск имеет универсальный синтаксис и позволяет проводить поиск по широкому перечню проектов Wikimedia – например, по wikipedia (статьи), по commons (иллюстрации, аудио, видео), по wiktionary (словарные записи).
Поиск по названию изображений выполняется так:
Запрос выше возвращает изображения, содержащие “аграрный университет” в названии.
Правки в статьи Википедию и в записи Викиданных могут вносить люди и боты, но история всех изменений доступна для просмотра. Подобная прозрачность, в сочетании с правилами противодействия Вандализму, Войнам правок и другим негативным проявлениям человеческого несогласия, повышают доверие читателей.
MediaWiki Action API
Запрос ниже возвращает информацию о 5 правках, внесенных после 01 января 2021 года в статью Lancet в англоязычной Википедии.
MediaWiki REST API
Запрос возвращает историю правок с id изменения, временем правки, данными о создателе (id, name), размером изменений (delta) и сопутствующими комментариями.
https://ru.wikipedia.org/w/rest.php/v1/page/Доклады%20Академии%20наук/history
Дополнив запрос выражением ?older_than=939967546
(или
?newer_than=1018790892
) можно получить более ранние (или поздние)
правки (вместо цифр подставлять id конкретной правки)
Добавив в запрос выражение ?filter=...
, можно отобрать только
определенные правки:
reverted
: правки, отменяющие более ранние измененияanonymous
: правки, сделанные анонимными пользователями (показывает IP),bot
: правки, сделанные ботами,minor
: правки, отмеченные как незначительные (minor edits)
Количество правок
https://en.wikipedia.org/w/rest.php/v1/page/The_BMJ/history/counts/edits
📌 Количество редакторов
https://en.wikipedia.org/w/rest.php/v1/page/The_BMJ/history/counts/editors
Wikimedia REST API
Запрос ниже возвращает последнюю правку и имя последнего пользователя
https://ru.wikipedia.org/api/rest_v1/page/title/Доклады%20Академии%20наук
Синтаксис запросов в Wikimedia Core REST API – https://api.wikimedia.org/wiki/Core_REST_API/Reference/Revisions/Get_page_history
MediaWiki Action API
MediaWiki Action API
Для получения текста правок добавьте в аргумент arvprop значение content.
Для получения правок, сделанных с IP-адреса, используйте IP-адрес вмето
имени пользователя в аргументе arvuser=...
MediaWiki Action API
Показывает максимум 60 дней (pvipdays=60).
Wikimedia REST API
Запрос ниже возвращает количество просмотров статьи о журнале The BMJ в англоязычной Википедии с 01 июня по 31 июля 2023 г.
Для того, чтобы цифры совпадали с запросом MediaWiki Action API необходимо вместо all-agents использовать user.
Другие веб-интерфейсы:
- https://meta.wikimedia.org/wiki/Pageviews_Analysis
- https://pageviews.wmcloud.org/
- http://stats.grok.se/json/en/latest30/Britney_Spears
- https://www.wikishark.com/title/en/The_BMJ
- https://wikipediaviews.org/
Wikimedia REST API
Wikimedia REST API
Wikimedia REST API
MediaWiki Action API
Можно искать ссылки только в статьях определенного типа, используя
выражение &eunamespace=...
и определенные значения (0 –
Wikipedia Page, 1 – Talk:Page, 2 – Профили пользователей, 3 – личные
User talk страницы).
Запрос ниже возвращает перечень статей Википедии (namespace = 0), в которых присутствуют гиперссылки на сайт издательства “Медиасфера”.
MediaWiki Action API
Запрос ниже возвращает перечень статей в русскоязычной Википедии, в которых присутствует гиперссылка на статью о Журнале экспериментальной и теоретической физике (ЖЭТФ).
Запрос ниже возвращает перечень статей Википедии, на которые ссылается выбранная статья.
MediaWiki Action API
https://en.wikipedia.org/w/api.php?action=parse&page=The%20BMJ&prop=links&format=json
MediaWiki Action API
Можно объединить ссылки с внутренними (на страницы Wikipedia), указав
prop=extlinks|links
.
[Альтернативный способ](https://www.mediawiki.org/wiki/API:Parsing_wikitext)
https://en.wikipedia.org/w/api.php?action=parse&page=The%20BMJ&prop=externallinks&format=json
Сведения о научных изданиях и публикациях непрерывно добавляются в Wikidata см. раздел Journals в сервисе Mix’n’match трудолюбивыми ботами и энтузиастами (см. 1, 2, что упрощает их цитирование в статьях Wikipedia.
Более того, крупнейшие мировые издатели предоставляют бесплатный доступ к своим полнотекстовым архивам для опытных редакторов Wikipedia. Не только потому, что это источник трафика, но и потому, что Википедию читают в том числе и люди вне академической среды, которые оценят готовые ссылки на научные источники (журналисты, лоббисты, просветители, волонтеры, школьники, учителя и другие категории небезразличных и незащищенных от информационного воздействия граждан).
Цитирования статей в Википедии учитываются аналитическими инструментами (Altmetric, Plum Analytics, а также CrossRef (см. Event Data API и Relations API).
Связанность данных в Wikidata позволяет расширить диапазон возможностей для анализа научных журналов, публикаций, авторов (см. ссылки ниже).
-
🎨 Профиль журнала ЖЭТФ в сервисе Reasonator / на основе Викиданных)
-
🎨 Профиль журнала ЖЭТФ в сервисе Scholia / на основе Викиданных)
И хотя сервис Wikidata, как источник сведений для библиометрического анализа, не может всерьез рассматриваться как альтернатива Web of Science или Scopus, он позволяет включить в анализ новые данные, которые в вышеупомянутых индексах цитирования отсутствуют. Запросы ниже призваны проиллюстрировать данный тезис.
Запрос ниже возвращает список журналов, которые относятся к типу/подклассу Q5633421 (scientific journal) или Q737498 (academic journal), и для атрибута P495 (country of origin) имеют значение Russia (Q159).
Wikidata SPARQL
SELECT DISTINCT ?journal ?name WHERE {
VALUES ?type {wd:Q5633421 wd:Q737498}
?journal wdt:P31/wdt:P279* ?type; wdt:P495 wd:Q159.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en, ru".
?journal rdfs:label ?name .
}
}
отправить через Wikidata Query Service
Wikidata SPARQL
SELECT ?journal ?journal_title (count(distinct(?item)) as ?count)
WITH {
SELECT DISTINCT ?journal ?journal_title
WHERE {
VALUES ?type {wd:Q5633421 wd:Q737498}.
?journal wdt:P31/wdt:P279 ?type; wdt:P495 wd:Q159.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,ru".
?journal rdfs:label ?journal_title.
}
}
} as %sss
WHERE {
INCLUDE %sss .
?item wdt:P1433 ?journal; wdt:P31 wd:Q13442814.
}
GROUP BY ?journal ?journal_title
отправить через Wikidata Query Service
Согласно правилам Wikidata при присвоении значения атрибуту (Property) объекта рекомендуется указывать источник (Reference). Запрос ниже извлекает из карточки журнала Russian Chemical Reviews (Q3453517) значения атрибута P236 (ISSN) и указанные для них источники типов P248 (ссылка на источник, который присутствует в Wikidata как описанный объект – ЕГРЮЛ или перечень журналов ERA 2012) или P143 (извлечено из других Вики-сервисов – Wikipedia).
Wikidata SPARQL
SELECT ?issn ?ref ?refLabel
WHERE {
wd:Q3453517 p:P236 [
ps:P236 ?issn; prov:wasDerivedFrom [
pr:P248|pr:P143 ?ref
]
].
SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
отправить через Wikidata Query Service
Запрос ниже находит элементы Wikidata, содержащие значения ISSN 1550-8943 и 0007-1447, и для каждого извлекает значения для широкого набора атрибутов.
Wikidata SPARQL
SELECT DISTINCT ?item ?types ?issns ?issnLs ?titles ?short_titles
?itemlabel_en ?itemlabel_ru ?countries ?langs ?publishers ?websites
?articleEN ?articleRU ?elibrary ?openalex_ids ?scilit_ids ?nlm_ids
?cref_ids ?coci_ids ?scids ?dim_ids ?doaj_ids ?bnf_ids ?sudoc_ids ?gnd_ids
?eics ?eic_orcids ?editors ?editor_orcids ?inception ?founded ?part_of ?has_part
?follows ?followed ?replaces ?replaced ?discontinued ?translation ?subjects
WITH {
SELECT DISTINCT ?item
(GROUP_CONCAT(DISTINCT ?website; separator = " | ") as ?websites)
(GROUP_CONCAT(DISTINCT ?typeLabel; separator = " | ") as ?types)
(GROUP_CONCAT(DISTINCT ?title; separator = " | ") as ?titles)
(GROUP_CONCAT(DISTINCT ?short_title; separator = " | ") as ?short_titles)
(GROUP_CONCAT(DISTINCT ?main_subjectLabel; separator = " | ") as ?subjects)
(GROUP_CONCAT(DISTINCT ?publisherLabel; separator = " | ") as ?publishers)
(GROUP_CONCAT(DISTINCT ?country; separator = " | ") as ?countries)
(GROUP_CONCAT(DISTINCT ?language; separator = " | ") as ?langs)
(GROUP_CONCAT(DISTINCT ?issn; separator = " | ") as ?issns)
(GROUP_CONCAT(DISTINCT ?issnL; separator = " | ") as ?issnLs)
(GROUP_CONCAT(DISTINCT ?openalex; separator = " | ") as ?openalex_ids)
(GROUP_CONCAT(DISTINCT ?dimensions; separator = " | ") as ?dim_ids)
(GROUP_CONCAT(DISTINCT ?crossref; separator = " | ") as ?cref_ids)
(GROUP_CONCAT(DISTINCT ?nlm; separator = " | ") as ?nlm_ids)
(GROUP_CONCAT(DISTINCT ?coci; separator = " | ") as ?coci_ids)
(GROUP_CONCAT(DISTINCT ?bnf; separator = " | ") as ?bnf_ids)
(GROUP_CONCAT(DISTINCT ?gnd; separator = " | ") as ?gnd_ids)
(GROUP_CONCAT(DISTINCT ?doaj; separator = " | ") as ?doaj_ids)
(GROUP_CONCAT(DISTINCT ?sudoc; separator = " | ") as ?sudoc_ids)
(GROUP_CONCAT(DISTINCT ?scilit; separator = " | ") as ?scilit_ids)
(GROUP_CONCAT(DISTINCT ?scid; separator = " | ") as ?scids)
(GROUP_CONCAT(DISTINCT ?editor_orcid; separator = " | ") as ?editor_orcids)
(GROUP_CONCAT(DISTINCT ?eic_orcid; separator = " | ") as ?eic_orcids)
(GROUP_CONCAT(DISTINCT ?editorLabel; separator = " | ") as ?editors)
(GROUP_CONCAT(DISTINCT ?eicLabel; separator = " | ") as ?eics)
WHERE{
?item wdt:P236 ?query. FILTER(?query in ("1550-8943", "0007-1447")).
optional{?item wdt:P31 ?type. ?type rdfs:label ?typeLabel.
FILTER(lang(?typeLabel)="en").}
optional{?item wdt:P236 ?issn.}
optional{?item wdt:P7363 ?issnL.}
optional{?item wdt:P5115 ?doaj.}
optional{?item wdt:P10283 ?openalex.}
optional{?item wdt:P8375 ?crossref.}
optional{?item wdt:P3181 ?coci.}
optional{?item wdt:P1156 ?scid.}
optional{?item wdt:P6180 ?dimensions.}
optional{?item wdt:P268 ?bnf.}
optional{?item wdt:P227 ?gnd.}
optional{?item wdt:P1025 ?sudoc.}
optional{?item wdt:P7662 ?scilit.}
optional{?item wdt:P1055 ?nlm.}
optional{?item wdt:P856 ?website.}
optional{?item wdt:P1476 ?title}
optional{?item wdt:P1813 ?short_title.}
optional{?item wdt:P407 ?ll. ?ll rdfs:label ?language.
FILTER(lang(?language)="en")}
optional{?item wdt:P495 ?cc. ?cc rdfs:label ?country.
FILTER(lang(?country)="en")}
optional{?item wdt:P921 ?main_subject.
?main_subject rdfs:label ?main_subjectLabel.
FILTER(lang(?main_subjectLabel)="en") }
optional{?item wdt:P123 ?publisher.
?publisher rdfs:label ?publisherLabel.
FILTER(lang(?publisherLabel)="en")}
optional{?item wdt:P5769 ?eic.
?eic rdfs:label ?eicLabel.
FILTER(lang(?eicLabel)="en").
optional{?eic wdt:P496 ?eic_orcid.}}
optional{?item wdt:P98 ?editor.
?editor rdfs:label ?editorLabel.
FILTER(lang(?editorLabel)="en").
optional{?editor wdt:P496 ?editor_orcid.}}
}
GROUP BY ?item ?itemlabel_en
} as %sss
WHERE {
INCLUDE %sss .
optional{?item rdfs:label ?itemlabel_en. FILTER(lang(?itemlabel_en)="en")}
optional{?item rdfs:label ?itemlabel_ru. FILTER(lang(?itemlabel_ru)="ru")}
optional{?item wdt:P10952 ?elibrary}
optional{?item wdt:P571 ?inception}
optional{?item wdt:P112 ?founded}
optional{?item wdt:P527 ?has_part}
optional{?item wdt:P361 ?part_of}
optional{?item wdt:P155 ?follows}
optional{?item wdt:P156 ?followed}
optional{?item wdt:P1365 ?replaces}
optional{?item wdt:P1366 ?replaced}
optional{?item wdt:P2669 ?discontinued}
optional{?item wdt:P9745 ?translation}
optional {
?articleEN schema:about ?item.
?articleEN schema:isPartOf <https://en.wikipedia.org/>.
?articleRU schema:about ?item.
?articleRU schema:isPartOf <https://ru.wikipedia.org/>.
}
}
отправить через Wikidata Query Service
Запрос ниже находит в Wikidata записи, соответствующие статьям из “Палеонтологического журнала” и имеющие значение DOI, и возвращает для каждой статьи название, перечень цитирующих журналов и общее количество цитирований.
Wikidata SPARQL
SELECT DISTINCT ?doi ?itemLabel ?citingJournalLabel
(count(distinct(?citing_pub)) as ?count)
WHERE {
?item wdt:P1433 wd:Q246955;
wdt:P356 ?doi.
optional{
?citing_pub wdt:P2860 ?item;
wdt:P1433 ?citingJournal.
}
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE], en, ru".
?item rdfs:label ?itemLabel .
?citingJournal rdfs:label ?citingJournalLabel .
}
}
GROUP BY ?doi ?itemLabel ?citingJournalLabel
ORDER BY ?itemLabel
отправить через Wikidata Query Service
Запрос ниже возвращает перечень авторов (P50 = author) статей (P1433 = published in) из “Палеонтологического журнала”, имеющих атрибут ORCID (P496).
Wikidata SPARQL
SELECT DISTINCT ?author_id ?orcid ?author
WHERE {
?item wdt:P1433 wd:Q246955.
optional{
?item p:P50 ?author_statement .
?author_statement ps:P50 ?author_id .
?author_id wdt:P496 ?orcid. }
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE], en, ru".
?author_id rdfs:label ?author .
}
}
отправить через Wikidata Query Service
Запрос ниже возвращает перечень авторов (P50 = автор) работ, цитирующих статьи (P2860 = cites work) из журнала “Молекулярная биология”, имеющих награды (P166 = award received) и чей пол (P21 = gender) указан в Википедии как женский (Q6581072). Для каждого автора запрос возвращает объединенный перечень наград и значение идентификатора ORCID (при наличии).
Wikidata SPARQL
SELECT ?authorLabel ?orcid ?awards
WITH {
SELECT ?author
(GROUP_CONCAT(DISTINCT(?award); separator=" | ") AS ?awards)
WHERE {
?work wdt:P1433 wd:Q4300349.
?reference_pub wdt:P2860 ?work.
?reference_pub wdt:P50 ?author .
?author p:P166 ?award_statement.
?award_statement ps:P166 ?award_.
?author wdt:P21 wd:Q6581072 .
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" .
?award_ rdfs:label ?award.
}
}
GROUP BY ?author
} AS %result
WHERE {
INCLUDE %result
optional{?author wdt:P496 ?orcid .}
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" .
?author rdfs:label ?authorLabel.
}
}
отправить через Wikidata Query Service
Wikidata SPARQL
SELECT DISTINCT ?author ?authorLabel ?orcid ?article
WHERE {
?author wdt:P31 wd:Q5;
wdt:P27 wd:Q159;
wdt:P496 ?orcid.
?article schema:about ?author;
schema:isPartOf <https://ru.wikipedia.org/>.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" . }
}
отправить через Wikidata Query Service
Запрос ниже возвращает найденных в Wikidata людей, имеющих страницу в англоязычной Wikipedia, чей род занятий (P106 = occupation) указан как Q901 = scientist, и с указанной датой рождения, согласно которой возраст этих ученых на 23 мая 2023 года не превышал 30 лет. Запрос исключает людей, у которых присутствует значение атрибута P570 = date of death.
Wikidata SPARQL
SELECT ?sitelink ?itemLabel WHERE {
?item wdt:P106 wd:Q901;
wdt:P31 wd:Q5;
wdt:P569 ?born .
FILTER (?born >= "1993-05-23T00:00:00Z"^^xsd:dateTime).
# exclude if there is a date of death
MINUS {?item wdt:P570 []}
?sitelink schema:about ?item ;
schema:isPartOf <https://en.wikipedia.org/>.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en"
}.
}
ORDER BY ?itemLabel
отправить через Wikidata Query Service
Запрос находит список элементов Wikidata, соответствующих авторам статей с DOI (P356), цитировавших статьи (также имеющие DOI) из журнала Russian Journal of Organic Chemistry. Для каждого автора возвращаются ORCID, список DOI цитирующих публикаций, список DOI и количество процитированных статей из искомого журнала.
Wikidata SPARQL
SELECT DISTINCT ?citing_author ?citing_authorLabel
(GROUP_CONCAT(DISTINCT ?orcid; separator = "; ") as ?orcids_yes_sometimes_few)
(GROUP_CONCAT(DISTINCT ?citing_doi; separator = "; ") as ?list_of_citing_dois)
(COUNT(DISTINCT ?doi) AS ?n_dois)
(GROUP_CONCAT(DISTINCT ?doi; separator = "; ") as ?list_of_cited_dois)
WHERE {
?item wdt:P1433 wd:Q3453520;
wdt:P356 ?doi.
?citing_work wdt:P2860 ?item;
wdt:P50 ?citing_author;
wdt:P356 ?citing_doi.
optional{?citing_author wdt:P496 ?orcid.}
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en".
}
}
GROUP BY ?citing_authorLabel ?citing_author
ORDER BY DESC(?n_dois)
отправить через Wikidata Query Service
Запрос ниже возвращает перечень организаций, чьи сотрудники (P108 = employer) в своих работах (P50 = author) цитировали (P2860 = cites work) статьи из журнала “Вестник офтальмологии”. Для каждой организации возвращается страна, количество процитированных публикаций из журнала “Вестник офтальмологии” и их названия.
Wikidata SPARQL
SELECT DISTINCT ?citing_organizationLabel ?citing_countryLabel
(COUNT(DISTINCT ?item) AS ?n_items)
(GROUP_CONCAT(DISTINCT ?itemLabel; separator = " | ") as ?list_of_items)
WHERE {
?item wdt:P1433 wd:Q27713783;
rdfs:label ?itemLabel.
FILTER (LANG (?itemLabel) = "en" ).
?citing_work wdt:P2860 ?item;
wdt:P50 ?citing_author .
?citing_author wdt:P108 ?citing_organization .
?citing_organization wdt:P17 ?citing_country.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en".
}
}
GROUP BY ?citing_organizationLabel ?citing_countryLabel
ORDER BY DESC (?n_items)
отправить через Wikidata Query Service
Запрос возвращает элементы Wikidata, соответствующие публикациям из “Палеонтологического журнала”, которые были процитированы другими публикациями (также имеющими записи в Wikidata). Для каждой статьи искомого журнала, имеющей цитирование, приведено название статьи, количество организаций публикаций,
Wikidata SPARQL
SELECT DISTINCT ?doi ?title
(COUNT(DISTINCT ?citing_work) AS ?n_cites)
(GROUP_CONCAT(DISTINCT ?citing_organizationLabel; separator = "; ") as ?citing_orgs)
(GROUP_CONCAT(DISTINCT ?citing_countryLabel; separator = "; ") as ?citing_countries)
WHERE {
?item wdt:P1433 wd:Q246955;
wdt:P356 ?doi.
?citing_work wdt:P2860 ?item;
wdt:P50 ?citing_author .
?citing_author wdt:P108 ?citing_organization .
?citing_organization wdt:P17 ?citing_country.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en".
?citing_organization rdfs:label ?citing_organizationLabel.
?citing_country rdfs:label ?citing_countryLabel.
?item rdfs:label ?title.
}
}
GROUP BY ?doi ?title
ORDER BY DESC(?n_cited)
отправить через Wikidata Query Service
Запрос возращает карту с расположением элементов Викиданных типа университет (Q3918), расположенных (P625 = coordinate location) в радиусе 0.5 км от станций метро (Q928830).
Для того, чтобы увидеть перечень результатов в виде таблицы, измените #defaultView в начале запроса на Table (или воспользуйтесь выпадающим меню, расположенным над картой с левой стороны).
Wikidata SPARQL
#defaultView:Map
SELECT ?place ?placeLabel ?subwayLabel ?location WHERE
{
?subway wdt:P131+ wd:Q649;
wdt:P31 wd:Q928830.
?subway wdt:P625 ?arcLoc .
SERVICE wikibase:around {
?place wdt:P625 ?location .
bd:serviceParam wikibase:center ?arcLoc .
bd:serviceParam wikibase:radius "0.5" .
}
?place wdt:P31 wd:Q3918.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "ru" .
}
}
отправить через Wikidata Query Service
Ответы на этот вопрос частично освещены в статьях:
-
“О профилях организаций в Wikidata”, (2022).
Можно выделить 3 подхода:
(а) “ручками”. Профиль журнала, главного редактора, организации-учредителя быстрее всего поправить именно так. С помощью поисковых запросов в интерфейсе Wikidata проверьте, существует ли уже профиль (поиск по вариантам названия, ФИО, ORCID, ISSN). Если профиля нет, смело нажимайте Creare a new item (Создать новый элемент) в меню левой панели. При создании достаточно указать язык описания, название, краткое описание и варианты названий (потом вы сможете изменить все эти поля или добавить новые).
Порог входа – зарегистрироваться в Wikidata. При создании полей ориентируйтесь на рекомендации в статьях выше и примеры оформления других журналов.
(б) через специальные инструменты Wikidata. После преодоления порога в 50 правок пользователи аккаунтов старше 4 дней приобретают статус Autoconfirmed Users (в рускоязычной версии статьи указан порог в 15 правок). В любом случае этот порог преодолется незаметно при заполнении первых карточек.
А далее в вашем распоряжении появятся множество инструментов для редактирования Викиданных, из которых кратко рассмотрим два: Quick Statements и SourceMD, которые чуть подробнее рассмотрим ниже.
(в) через API-интерфейс Swagger API документация. Если вы умеете пользоваться REST API, дополнительные комментарии не требуются. Если же это ваше первое столкновение с методами REST API, прежде чем править Викиданные, хорошенько изучите инструкции, начните тренировки с безопасного метода (GET) и потом "поиграйте в песочнице", в которую можно вносить правки.
Этот сервис позволяет вносит изменения в Wikidata без опыта работы с API и головоломными 😬 механизмами авторизации.
Для работы пользователь должен иметь статус Autoconfirmed user, предварительно авторизоваться в Wikidata и дать разрешения всплывающим запросам. Если после авторизации вы видите имя своего пользователя в правом углу и после нажатия на New Batch видите поле для ввода, значит интерфейс готов к работе. За кнопкой с именем пользователя скрывается приятный сюрприз 😉 для, кто умеет использовать API.
Небольшой пример:
Внесем в карточку пользователя Q118779563 2 новых свойства: идентификатор автора в OpenAlex. Синтаксис QuickStatements очень прост – в одной строке, через табуляцию или знак “|”, перечисляются entity|property|value, что для нашей задачи приводит к строкам следующего вида:
Q118779563|P10283|"A2638483588"
Нажимаем Import V1 Commands, в открывшемся интерфейсе проверяем, что будет сформировано, после чего нажимаем Run in background (система предложить назвать данный набор правок. Например, “OA id for Q118779563”). Если наверху появится Status DONE и индикатор прогресса целиком зеленый и показывает 100%, значит, результат достигнут.
Проверяем:
способ 0
Открыв карточку Q118779563
способ 1
Поиском A2638483588 в интерфейсе Wikidata
способ 2
Wikidata SPARQL
SELECT ?person ?openalex_id
WHERE {
VALUES ?person {wd:Q118779563}
?person wdt:P10283 ?openalex_id.
}
отправить через Wikidata Query Service
способ 3
Wikidata API
https://www.wikidata.org/w/rest.php/wikibase/v0/entities/items/Q118779563/statements?property=P10283
-
Новая версия - (прим. у автора капризничает с авторизацией).
Этот сервис многократно облегчает задачу по переносу метаданных статей из CrossRef в Викиданные.
- вносим список DOI (1 doi в строке)
- нажимаем Check source
- сервис проверяет по DOI наличие статей в Wikidata.
Если публикация уже присутствует в Wikidata, то сверху над полем появится формулировка вида
Other sources with these identifiers exist: Q…. Trying to update values of Q….; this will not change existing ones.
для отсутствующих предлагает внести базовые сведения в формате Quick Statements (см. ☝️), с той разницей, что в качестве разделителя вместо | используется табуляций (оба варианта подходят для QuickStatements).
Пример добавления статьи 10.24069/SEP-22-40
CREATE
LAST P356 "10.24069/SEP-22-40"
LAST P31 Q13442814
LAST P1476 en:"Tabular form of description of statistical methods and programs in scientific publications"
LAST Len "Tabular form of description of statistical methods and programs in scientific publications"
LAST P433 "2"
LAST P304 "182-184"
LAST P478 "7"
LAST P577 +2023-04-14T00:00:00Z/11
LAST P1433 Q96728083
LAST P2093 "N. N. Khromov-Borisov" P1545 "1"
Если ввести несколько DOI, то сервис вернет фрагменты для отдельных статей, расположенные друг над другом. Блок каждой статьи начинается с CREATE, который “дает команду” создать запись, к которой будут применены инструкции в следующих строках, начинающихся с LAST.
Какие атрибуты будут созданы?
-
P31 (тип элемента) = scholarly article Q13442814
-
P1476 (тип элемента) = title, с указанием языка (en)
-
Len - это Label на английском, который отражается в заголовках Wikidata карточек.
-
P478 (том) = volume
-
P433 (выпуск) = issue
-
P304 (страницы) = pages
-
P577 (дата публикации) = publication date
-
P1433 (опубликовано в) = published in.
⚠️ Поскольку в Wikidata уже существует карточка журнала с указанием ISSN и в метаданных CrossRef есть ISSN, то атрибут P1433 сразу связывает статьи с записью журнала Q96728083. -
P2093 (строка с указанием имени автора) = author string с указанием P1545 (порядковый номер автора).
Обратите внимание, что будет создана не связь с карточкой автора (сервис не распознает авторов по фамилии), а только текстовое значение.
LAST P50 {Wikidata ID автора} P1545...
Получится вот так
CREATE
LAST P356 "10.24069/SEP-22-40"
LAST P31 Q13442814
LAST P1476 en:"Tabular form of description of statistical methods and programs in scientific publications"
LAST Len "Tabular form of description of statistical methods and programs in scientific publications"
LAST P433 "2"
LAST P304 "182-184"
LAST P478 "7"
LAST P577 +2023-04-14T00:00:00Z/11
LAST P1433 Q96728083
LAST P2093 "N. N. Khromov-Borisov" P1545 "1"
LAST P50 Q70155088 P1545 "1"
Нажимаем кнопку Open in Quick Statements, в открывшемся интерфейсе проверяем, что будет сформировано, после чего нажимаем Run in background (система предложить назвать данный набор правок. Например, “article 1”). Если наверху появится Status DONE и индикатор прогресса будет показывать 100%, то всё – статья внесена в Wikidata.
Как найти созданную статью?
В карточке автора статья не отражается, поскольку это не статья является атрибутом автора, а наоборот – автор выступает в качестве атрибута статьи (спасибо, что не AMDG по умолчанию).
способ 1
Поиском 10.24069/SEP-22-40 в интерфейсе Wikidata
Способ 2
Выполнив поиск по DOI в Wikidata или с помощью SPARQL запроса (пример ниже).
SELECT ?article ?doi
WHERE {
VALUES ?doi {"10.24069/SEP-22-40"}
?article wdt:P356 ?doi.
}
отправить через Wikidata Query Service
Идентификатор созданной статьи – Q118798976.
Итак, оптимальная стратегия примерно следующая:
-
регистрируем профиль в Wikidata
-
создаем/редактируем вручную индивидуальные карточки журналов, организации-учредителя, редактора, пока не достигнем статус Autoconfirmed (отражается в меню Preferences Wikidata / раздел Basic information > Member of groups).
-
проверяем готовность к работе QuickStatements (разрешения)
-
вносим DOI через SourceMD
-
вносим атрибуты статей и авторов через QuickStatements (их можно готовить в любом текстовом или колоночном редакторе).
Созданными профилями любуемся в сервисе Scholia.
На момент подготовки статьи на сайте Энциклопедии Руниверсалис автору не удалось найти документацию API, но администраторы ТГ-канала указали, что MediaWiki API работает. Удалось обнаружить работающий MediaWiki Action API
Информация о статье
Краткий запрос, возвращающий только id статьи:
Запрос ниже возвращает более детальную json-структуру, из которой легко извлечь текст, категории (categories), ссылки на страницы (links), ссылка на внешние страницы (externallinks), перечень изображений (images), секций (sections), шаблонов (template), интер-вики ссылок (iwlinks – здесь ссылки на оригинальную Википедию и другие Викисервисы).
По сравнению с оригиналом (далее под оригиналом подразумевается MediaWiki API в оригинальной Wikipedia) отсутствуют идентификатор соответствующего статье элемента Викиданных (wikibase_item) и ссылки на языковые версии статей (раздел есть, но автор не встретил примеров статей, где он был бы заполнен).
Извлечь разделы статьи
Возвращает перечень разделов страницы, их размер, порядковые номера и названия внутренних ссылок.
Получив сведения из запроса выше, можно извлечь отдельные разделы в форматах wikitext или parsetree.
Извлечь категории статьи
Некоторые категории отмечены как hidden. Там много забавного – например, вышеприведенная статья о Кубинской революции отнесена к скрытой категории “Статьи_к_проверке:ЛГБТ_и_Ко”. К этой категории на 26 июля 2023 года была отнесена 4281 статья – туда попали статьи о квиритском праве, Иоанне Павле II, Джоне Керри, миндалевидном теле, движении “Наши” и многом другом, требующем “проверки” (см. запрос ниже).
История правок статьи
Запрос ниже возвращает информацию о 10 правках, внесенных после 01 декабря 2022 года в статью о бывшем словацком президенте (поскольку его имя Андрей Киска, разумеется, статья тоже попала в вышеупомянутую категорию).
Список пользователей, которые правили страницу
Запрос ниже возвращает список пользователей, которые редактировали статью о Крыме.
Можно добавить &pcgroup=bot, чтобы получить список редакторов-ботов.
Список всех правок пользователя
Запрос ниже возвращает в формате json правки пользователя Sergio «El Profesor» Marquina.
Для получения текста правок добавьте в аргумент arvprop значение content.
Поиск статей, цитирующих внешний web-сайт
Можно искать ссылки только в статьях определенного типа, используя
выражение &eunamespace=...
и определенные значения (0 – статьи,
1 – Talk:Page, 2 – Профили пользователей, 3 – личные User talk
страницы).
Запрос ниже возвращает перечень статей (namespace = 0), в которых присутствуют гиперссылки на сайт издательства “Медиасфера”.
Поиск статей, цитирующих выбранную страницу
Запрос ниже возвращает перечень статей, в которых присутствует гиперссылка на статью о Кубинской революции.
Гиперссылки из статьи, ведущие на другие статьи энциклопедии
Запрос ниже возвращает перечень статей энциклопедии, на которые ссылается выбранная статья.
Ссылки на внешние сайты с выбранной страницы
Можно объединить ссылки с внутренними (на страницы энциклопедии), указав
prop=extlinks|links
.
Альтернативный способ:
Поиск статьи по названию
Для поиска по названию используется не (srsearch=intitle:), а (srwhat=title).
https://руни.рф/api.php?action=query&list=search&srsearch=Казанский&srwhat=title&utf8=&format=json
Статистика просмотров страниц
Запрос ниже возвращает ошибку Unrecognized value for parameter "prop": pageviews
https://руни.рф/api.php?action=query&titles=%D0%9A%D1%80%D1%8B%D0%BC&prop=pageviews&format=json
На момент подготовки материала сайт РУВИКИ работал в бета-версии. Автору не удалось найти на сайте документации API, но поскольку РУВИКИ сделана на базе MediaWiki, то удалось обнаружить работающие MediaWiki Action API и MediaWiki REST API.
Информация о статье
https://ru.ruwiki.ru/w/api.php?action=query&titles=Весёлый Роджер&format=json
Запрос ниже возвращает более детальную json-структуру, из которой легко извлечь текст, категории (categories), ссылки на страницы (links), ссылка на внешние страницы (externallinks), перечень изображений (images), секций (sections), шаблонов (template), интер-вики ссылок (iwlinks – здесь ссылки на оригинальную Википедию и другие Викисервисы), идентификатор элемента Викиданных, соответствующего статье (wikibase_item в разделе properties)
https://ru.ruwiki.ru/w/api.php?action=parse&page=Весёлый Роджер&format=json
На 03.08.2023 ссылки на все языковые версии статьи (раздел langlinks) ведут на ru.ruwiki.ru и не функционируют (пример: https://ru.ruwiki.ru/wiki/Nl:Jolly_Roger).
Версия MediWiki REST API
Извлечь разделы статьи
Возвращает перечень разделов страницы, их размер, порядковые номера и названия внутренних ссылок.
https://ru.ruwiki.ru/w/api.php?action=parse&page=Весёлый Роджер&prop=sections&format=json
Получив сведения из запроса выше, можно извлечь отдельные разделы в форматах wikitext или parsetree.
Извлечь категории статьи
https://ru.ruwiki.ru/w/api.php?action=parse&page=Весёлый Роджер&prop=categories&format=json
Найти все статьи по категории
История правок статьи
Запрос ниже возвращает информацию о 10 правках, внесенных после 01 декабря 2022 года в статью о Весёлом Роджере.
Список пользователей, которые правили страницу
Запрос ниже возвращает список пользователей, которые редактировали статью о Крыме.
Чтобы получить список редакторов-ботов к запросу необходимо добавить &pcgroup=bot.
Список всех правок пользователя
Запрос ниже возвращает в формате json правки пользователя Beginner67, чей профиль пока в системе не отражается (beta есть beta.
Для получения текста правок добавьте в аргумент arvprop значение content.
Поиск статей, цитирующих внешний web-сайт
Можно искать ссылки только в статьях определенного типа, используя
выражение &eunamespace=...
и определенные значения (0 – статьи,
1 – Talk:Page, 2 – Профили пользователей, 3 – личные User talk
страницы).
Запрос ниже возвращает перечень статей (namespace = 0), в которых присутствуют гиперссылки на сайт издательства “Медиасфера”.
Поиск статей, цитирующих выбранную страницу
Запрос ниже возвращает перечень статей, в которых присутствует
гиперссылка на статью о Кубинской революции. >
https://ru.ruwiki.ru/w/api.php?action=query&titles=Изгнание_евреев_из_Испании&prop=linkshere&lhlimit=200&lhnamespace=0&format=json
Гиперссылки из статьи, ведущие на другие статьи энциклопедии
Запрос ниже возвращает перечень статей энциклопедии, на которые ссылается выбранная статья.
https://ru.ruwiki.ru/w/api.php?action=query&titles=Изгнание_евреев_из_Испании&prop=links&format=json
Ссылки на внешние сайты с выбранной страницы
Можно объединить ссылки с внутренними (на страницы энциклопедии), указав
prop=extlinks|links
.
Альтернативный способ:
Поиск статьи по названию
Для поиска по названию используется новый синтаксис (srsearch=intitle:), а srwhat=title не работает так же как и в оригинальной MediaWiki Action API.
https://ru.ruwiki.ru/w/api.php?action=query&list=search&srsearch=intitle:Казанский&utf8=&format=json
Статистика просмотров страниц
Функционал вывода количества просмотров работает, но возвращает нули.
https://ru.ruwiki.ru/w/api.php?action=query&titles=Крым&prop=pageviews&format=json
На момент подготовки статьи на сайте Циклопедии автору не удалось найти документацию API, но поскольку Циклопедия сделана на базе MediaWiki, то удалось обнаружить работающие MediaWiki Action API и MediaWiki REST API.
Информация о статье
https://cyclowiki.org/w/api.php?action=query&titles=Китайская кошка&format=json
Запрос ниже возвращает более детальную json-структуру, из которой легко извлечь текст, категории (categories), ссылки на страницы (links), ссылка на внешние страницы (externallinks), перечень изображений (images), секций (sections), шаблонов (template), интер-вики ссылок (iwlinks – здесь ссылки на оригинальную Википедию и другие Викисервисы).
https://cyclowiki.org/w/api.php?action=parse&page=Китайская кошка&format=json
По сравнению с оригиналом (далее под оригиналом подразумевается MediaWiki API в оригинальной Wikipedia) отсутствуют идентификатор соответствующего статье элемента Викиданных (wikibase_item) и ссылки на языковые версии статей (раздел есть, но автор не встретил примеров статей, где он был бы заполнен).
Версия MediWiki REST API
Извлечь разделы статьи
Возвращает перечень разделов страницы, их размер, порядковые номера и
названия внутренних ссылок. >
https://cyclowiki.org/w/api.php?action=parse&page=Китайская кошка&prop=sections&format=json
Получив сведения из запроса выше, можно извлечь отдельные разделы в форматах wikitext или parsetree.
Извлечь категории статьи
https://cyclowiki.org/w/api.php?action=parse&page=Китайская кошка&prop=categories&format=json
Найти все статьи по категории
История правок статьи
Запрос ниже возвращает информацию о 10 правках, внесенных после 01 декабря 2022 года в статью о Китайской кошке.
Список пользователей, которые правили страницу
Запрос ниже возвращает список пользователей, которые редактировали статью о Китайской кошке.
Чтобы получить список редакторов-ботов к запросу необходимо добавить &pcgroup=bot.
Список всех правок пользователя
Запрос ниже возвращает в формате json правки пользователя Serebr.
Для получения текста правок добавьте в аргумент arvprop значение content.
Поиск статей, цитирующих внешний web-сайт
Можно искать ссылки только в статьях определенного типа, используя
выражение &eunamespace=...
и определенные значения (0 – статьи,
1 – Talk:Page, 2 – Профили пользователей, 3 – личные User talk
страницы).
Запрос ниже возвращает перечень статей (namespace = 0), в которых присутствуют гиперссылки на сайт издательства “Медиасфера”.
Поиск статей, цитирующих выбранную страницу
Запрос ниже возвращает перечень статей, в которых присутствует гиперссылка на статью о Розе Люксембург.
Гиперссылки из статьи, ведущие на другие статьи энциклопедии
Запрос ниже возвращает перечень статей Циклопедии, на которые ссылается выбранная статья.
https://cyclowiki.org/w/api.php?action=query&titles=Компьютерная оптика&prop=links&format=json
Ссылки на внешние сайты с выбранной страницы
Можно объединить ссылки с внутренними (на страницы энциклопедии), указав
prop=extlinks|links
.
Альтернативный способ:
https://cyclowiki.org/w/api.php?action=parse&page=Компьютерная оптика&prop=externallinks&format=json
Поиск статьи по названию
Для поиска по названию используется не (srsearch=intitle:), а (srwhat=title).
Статистика просмотров страниц
Запрос ниже возвращает ошибку Unrecognized value for parameter "prop": pageviews
У сервиса http://www.wikiznanie.ru доступен MediaWiki Action API, ниже приведены примеры базовых запросов.
Сведения о статье
http://www.wikiznanie.ru/wikipedia/api.php?action=parse&page=Муравьи&format=json
Найти все статьи по категории
История правок статьи
Список пользователей, которые правили страницу
Список всех правок пользователя
Эта функция отключена.
Поиск статей, цитирующих внешний web-сайт
Поиск других статей ресурса, цитирующих выбранную страницу
Cсылки из статьи на другие статьи ресурса (links) и внешние сайты (extlinks)
Поиск статьи по тексту
Статистика просмотров страниц
Запрос ниже возвращает ошибку Unrecognized value for parameter "prop": pageviews
У сервиса доступен MediaWiki Action API, ниже приведены примеры базовых запросов.
Сведения о статье
https://traditio.wiki/w/api.php?action=parse&page=Иран&format=json
Найти все статьи по категории
История правок статьи
Список пользователей, которые правили страницу
Список всех правок пользователя
Поиск статей, цитирующих внешний web-сайт
Поиск других статей ресурса, цитирующих выбранную страницу
Cсылки из статьи на другие статьи ресурса (links) и внешние сайты (extlinks)
Поиск статьи по тексту
Статистика просмотров страниц
Запрос ниже возвращает ошибку Unrecognized value for parameter "prop": pageviews
https://traditio.wiki/w/api.php?action=query&titles=Жан-Поль Бельмондо&prop=pageviews&format=json
У сервиса доступен MediaWiki Action API, ниже приведены примеры базовых запросов.
Сведения о статье
https://ruxpert.ru/api.php?action=parse&page=Мифы_о_России&format=json
Найти все статьи по категории
История правок статьи
Список пользователей, которые правили страницу
Список всех правок пользователя
Поиск статей, цитирующих внешний web-сайт
Поиск других статей ресурса, цитирующих выбранную страницу
Cсылки из статьи на другие статьи ресурса (links) и внешние сайты (extlinks)
Поиск статьи по тексту
https://ruxpert.ru/api.php?action=query&list=search&srsearch=Газпром&srwhat=text&utf8=&format=json
Статистика просмотров страниц
Запрос ниже возвращает ошибку Unrecognized value for parameter "prop": pageviews
Ниже представлены русскоязычные ресурсы на основе MediaWiki. Перечень не претендует на полноту и составлен с единственной целью – показать читателям тематическое многообразие порталов, доступ к содержимому которых возможен через API-интерфейс.
-
http://m-protect.ru/wiki/index.php – Профессиональный информационно-аналитический ресурс, посвященный физической химии, нанотехнологиям, cупрамолекулярной химии и другим физико-химическим направлениям. API: http://m-protect.ru/wiki/api.php.
-
https://crimlib.info/ – Энциклопедии CrimLib.info. API: https://crimlib.info/api.php.
-
https://ru.crystalls.info – Энциклопедия “Выращивание кристаллов”. API: https://ru.crystalls.info/w/api.php.
-
http://wiki.laser.ru – Экспериментальная научная энциклопедия. API: http://wiki.laser.ru/api.php.
-
https://miningwiki.ru – Свободная шахтёрская энциклопедия. API: https://miningwiki.ru/w/api.php.
-
https://algowiki-project.org – Открытая энциклопедия свойств алгоритмов. API: https://algowiki-project.org/w/ru/api.php.
-
https://nlpub.ru – каталог ресурсов для обработки естественного языка (сведения об инструментах, ресурсах, методах и алгоритмах, необходимых для успешного построения систем автоматической обработки русского языка). API: https://nlpub.ru/api.php.
-
http://www.machinelearning.ru – Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных. API: http://www.machinelearning.ru/wiki/api.php.
-
http://neerc.ifmo.ru/wiki/ – Викиконспекты студентов кафедры компьютерных технологий Университета ИТМО. API: http://neerc.ifmo.ru/wiki/api.php.
-
https://wiki.mipt.tech – ВикиФизтех. API: https://wiki.mipt.tech/api.php.
-
http://wiki.mephist.ru – Энциклопедия МИФИ. API: http://wiki.mephist.ru/api.php.
-
https://wiki.spbu.ru – Энциклопедия СпБУ. API: https://wiki.spbu.ru/api.php.
-
http://wiki.fa100.ru – Энциклопедия Финансового университета: Годы и люди. База данных биографий, созданная на основании печатных и электронных источников, а также материалов, предоставленных самими выпускниками. API: http://wiki.fa100.ru/api.php.
-
http://wiki.cs.hse.ru – Wiki Факультета компьютерных наук ВШЭ. API: http://wiki.cs.hse.ru/api.php.
-
https://wikireshebnik.org – Викирешебник (сборник ответов, решений, объяснений всех задач и упражнений). API: https://wikireshebnik.org/w/api.php.
-
https://wiki.oldsaratov.ru – Энциклопедия старого Саратова. API: https://wiki.oldsaratov.ru/api.php.
-
http://wikirtishchevo.shoutwiki.com – Ртищевская краеведческая энциклопедия. API: http://wikirtishchevo.shoutwiki.com/w/api.php.
-
https://towiki.ru – Томская вики. API: https://towiki.ru/api.php.
-
http://wiki.tgl.net.ru – Тольяттинский вики-портал. API: http://wiki.tgl.net.ru/api.php.
-
http://лебедянь.рф – Лебедянская энциклопедия. API: http://лебедянь.рф/api.php.
-
https://kraeved.vp43.ru – Вики-поляны (открытый сетевой краеведческий проект о южной Вятке). API: https://kraeved.vp43.ru/api.php.
-
http://wiki-sibiriada.ru – свободный ресурс для коллективной работы библиотекарей, педагогов-краеведов, детей, подростков и молодежи над созданием, размещением и сохранением материалов Сибирского региона. API: http://wiki-sibiriada.ru/api.php.
На сайте проекта Летописи – https://letopisi.org можно найти много региональных образовательных вики-сайтов, созданных с целью развития у школьников и студентов навыков подготовки вики-материалов.
-
https://ru.rodovid.org/wk/ – открытое многоязычное генеалогическое древо. API: https://ru.rodovid.org/api.php (action=parse не работает, но есть работает query - см. пример запроса).
-
https://ru.migrapedia.org – большой миграционный справочник. API: https://ru.migrapedia.org/api.php.
-
https://hitchwiki.org/ru/ – АвтостопВики. API: https://hitchwiki.org/ru/api.php.
-
http://provizorii.ru – свободный энциклопедический интернет-проект на русском языке, посвящённый широкой тематике. Первоначально базировался на статьях о филателии. API: http://provizorii.ru/w/api.php.
-
https://bikeswiki.ru – Энциклопедия японских мотоциклов. API: https://bikeswiki.ru/api.php.
-
https://bikerwiki.ru – Энциклопедия и путеводитель по миру мотоциклистов. API: https://bikerwiki.ru/api.php.
-
https://wiki.nashtransport.ru – Энциклопедия нашего транспорта. API: https://wiki.nashtransport.ru/api.php.
-
https://wiki.zr.ru – Энциклопедия журнала “За рулём”. API: https://wiki.zr.ru/api.php.
-
https://chipwiki.ru – Chipwiki посвящена ретро- и околоретро-творчеству на компьютерах и игровых консолях: музыке, пиксель-арту и демосцене. API: https://chipwiki.ru/api.php.
-
https://greenwiki.ru – Интернет-журнал о сельском хозяйстве основанный на авторитетных источниках. API: https://greenwiki.ru/api.php.
-
https://libnotes.org – Нотный архив музыки академического направления. API: https://libnotes.org/api.php.
-
http://www.choirwiki.com – Хоровая энциклопедия. API: http://www.choirwiki.com/api.php.
-
http://wiki.risk.ru – Живая Энциклопедия Приключений (сведения о местах, людях, маршрутах, снаряжении, технологиях и материалах). API: http://wiki.risk.ru/api.php.
-
https://летнийлагерь.рф – МетодВики для вожатых (ресурс для вожатых детских оздоровительных лагерей). API: http://летнийлагерь.рф/api.php.
-
https://wikimultia.org – свободная энциклопедия анимации. API: https://wikimultia.org/api.php.
-
https://rkka.wiki – Указатель частей и соединений РККА 1941-1945. API: https://rkka.wiki/api.php.
-
https://nkvd.memo.ru – Кадровый состав органов государственной безопасности СССР. 1935−1939. API: https://nkvd.memo.ru/api.php.
-
https://ru.openlist.wiki – «Открытый список» | база данных жертв политических репрессий в СССР | 1917—1991 гг. API: https://ru.openlist.wiki/api.php.
-
https://neolurk.org/ – энциклопедия мемов, культуры и интернетов. API: https://neolurk.org/w/api.php.
-
https://wikireality.ru – Викиреальность (“интеллектуальный клуб”, работающий над свободной энциклопедией об Интернете). API: https://wikireality.ru/w/api.php.
-
http://wikicompromat.org. API: http://wikicompromat.org/w/api.php.
-
https://bard-wiki.net. Бард-Вики. API: https://bard-wiki.net/api.php.
-
https://wikilivres.ru. Викиливр.ру – свободная библиотека. API: https://wikilivres.ru/api.php.
На сайте Fandom (портал, предоставляющий бесплатную возможность создания вики-сайта) можно найти большой список вики-сообществ. Портал ориентируется главным образом на сообщества фанатов медиа-культуры. Подавляющее большинство сообществ в списке прекратили обновляться, не достигнув и 100 статей. Несмотря на непривычный интерфейс, сайты основаны на Mediawiki, поэтому для обращения к ним можно использовать вышеописанные запросы.
Среди многочисленных фан-сообществ можно найти крупные русскоязычные проекты другой направленности:
-
https://extinct-animals.fandom.com – Вымершие животные Вики. API для русскоязычных статей: https://extinct-animals.fandom.com/ru/api.php.
-
https://vlab.fandom.com/ru – Виртуальная лаборатория. API: https://vlab.fandom.com/ru/api.php.
-
https://science.fandom.com/ – Викинаука. Свыше 23 тысяч статей, но проект уже несколько лет не обновляется. API: https://science.fandom.com/ru/api.php.
Сайт Miraheze предоставляет (как и Fandom) возможность бесплатного создания собственного Wiki-проекта. Каталог русскоязычных вики-проектов содержит десятки разнообразных проектов:
-
https://partopedia.miraheze.org – Партопедия. Энциклопедия политических партий, движений, и организаций всего мира. API: https://partopedia.miraheze.org/w/api.php.
-
https://texnopedia.miraheze.org – Технопедия. Свободная энциклопедия, посвященная технике, программному обеспечению, компьютерам и другим смежным областям науки и технологий. API: https://texnopedia.miraheze.org/w/api.php.
-
https://pluspi.miraheze.org – PlusPi. Интернет-решебник задач. API: https://pluspi.miraheze.org/w/api.php.
-
Глобальный live-монитор вики-сайтов – ссылка открывает перечень MediaWiki сайтов, на которых более 10 тысяч “добротных” статей.
-
WikiApiary – каталог вики-проектов.
-
Каталог wiki-проектов на основе ПО MediaWiki на WikiIndex. Научные wiki: https://wikiindex.org/Category:Science.
-
Wiki-проекты в области биологии и биоразнообразия на платформе Biowikifarm meta – biowikifarm.net is a shared technical platform supporting a number of mediawiki installations used by a diverse array of projects in biology, and especially biodiversity research.
-
Региональные wiki-проекты на LocalWiki. Встречаются довольно развитые проекты вроде Local Wiki for Santa Cruz.
-
https://handwiki.org – HandWiki. A wiki encyclopedia for collaborative editing of articles on computing, science, technology and general knowledge. API: https://handwiki.org/wiki/api.php.
-
https://opencircuits.com – Open Circuits. A wiki for sharing open source electronics knowledge, schematics, board layouts, ports and parts libraries. API: https://opencircuits.com/api.php.
-
https://en.wikivet.net – Wiki Vet. Free veterinary encyclopedia. Submissions welcome and are reviewed by renowned veterinary professionals. API: https://en.wikivet.net/api.php.
-
http://www.gardenology.org – Plant & Garden Wiki Encyclopedia. Free veterinary encyclopedia. Submissions welcome and are reviewed by renowned veterinary professionals. API: http://www.gardenology.org/w/api.php.
-
https://openei.org – OpenEI. Linked energy information on hundreds of topics crowdsourced from industry and government agencies, supported by U.S. DEPARTMENT OF ENERGY. API: https://openei.org/w/api.php.
-
https://openwetware.org – OpenWetWare is an effort to promote the sharing of information, know-how, and wisdom among researchers and groups who are working in biology & biological engineering. API: https://openwetware.org/mediawiki/api.php.
-
http://www.cpdl.org – ChoralWiki, home of the Choral Public Domain Library. API: http://www.cpdl.org/wiki/api.php.
-
https://www.theaquariumwiki.com – The Aquarium Wiki. The free encyclopedia of all things aquatic. API: https://www.theaquariumwiki.com/w/api.php.
-
https://akvopedia.org – Akvopedia. A free, open-sourced water, sanitation & hygiene resource. API: https://akvopedia.org/s_wiki/api.php.
-
https://www.openwaterpedia.com – Openwaterpedia is the Wikipedia for the open water swimming world. API: https://www.openwaterpedia.com/api.php.
-
https://petrowiki.spe.org – PetroWiki was created from the seven volume Petroleum Engineering Handbook (PEH) published by the Society of Petroleum Engineers (SPE). API: https://petrowiki.spe.org/w/api.php.
⚠️ PetroWiki is copyrighted by the Society of Petroleum Engineers. It is not licensed for reuse like Wikipedia. If you want to reuse material from PetroWiki, you must be certain to use appropriate citation and obtain permissions where needed. -
https://www.antwiki.org – Antwiki provides a wealth of information on the world’s ants. API: https://www.antwiki.org/wiki/api.php.
-
https://wiki.pestinfo.org – Antwiki provides a wealth of information on the world’s ants. API: https://www.antwiki.org/wiki/api.php.
-
https://helminthictherapywiki.org – Helminthic Therapy Wiki. API: https://helminthictherapywiki.org/wiki/api.php.
-
https://www.wikicu.com – WikiCU is a wiki with articles related to Columbia University and its neighborhood. It is effectively an insider’s guide to Columbia University. API: https://www.wikicu.com/api.php.
-
https://soil.evs.buffalo.edu – Soil Ecology Wiki. API: https://soil.evs.buffalo.edu/api.php.
-
https://www.wikilawschool.net – Wiki Law School: open and free collaborative outlines, case briefs, treatises, and more created for and by law students and legal professionals. API: https://www.wikilawschool.net/w/api.php.
-
https://wiki.opensourceecology.org – Open Source Ecology: a public organization that envisions collaborative design for a transparent and inclusive economy of abundance. OSE is an education organization that hosts immersion workshops and training programs on hands-on, applied skills to design and build just about anything. API: https://wiki.opensourceecology.org/api.php.
-
https://www.sourcewatch.org – The Center for Media and Democracy publishes SourceWatch to track corporations. We provide well-documented information about corporate public relations (PR) campaigns, including corporate front groups, people who “front” corporate campaigns, and PR operations. API: https://www.sourcewatch.org/api.php.
-
https://logos.fandom.com – Logopedia is a collaborative database for logos and branding. API: https://logos.fandom.com/api.php.
-
https://vintagepatterns.fandom.com – Vintage Patterns is dedicated to documenting Vintage Sewing Patterns (25 years old or older). API: https://vintagepatterns.fandom.com/api.php.
-
https://tango.info/wiki/ – Tango.info. API: https://tango.info/x/wiki/w/api.php.
В некоторых проектов API-интерфейс, к сожалению, отключен:
-
http://wiki.gis.com – Wiki.GIS.com is an encyclopedia dedicated to geographic information systems (GIS). API: MediaWiki API is not enabled for this site.
-
https://proteopedia.org – Proteopedia. A Database of proteins, supported by The Israel Structural Proteomics Center at the Weizmann Institute of Science. API: MediaWiki API is not enabled for this site.
-
https://ru.wikiquote.org – Викицитатник (en:Wikiquote). API: https://ru.wikiquote.org/w/api.php.
-
https://ru.wikibooks.org – Викикниги (en:Wikibooks). API: https://ru.wikibooks.org/w/api.php.
-
https://ru.wikinews.org – Викиновости (en:Wikinews). API: https://ru.wikinews.org/w/api.php.
-
https://ru.wikivoyage.org – ВикиГид (en:WikiVoyage). API: https://ru.wikivoyage.org/w/api.php.
-
https://ru.wikiversity.org – Викиверситет. API: https://ru.wikiversity.org/w/api.php.
-
https://species.wikimedia.org - WikiSpecies. The free species directory covering Animalia, Plantae, Fungi, Bacteria, Archaea, Protista and all other forms of life. API: https://species.wikimedia.org/w/api.php.
http://www.subtiwiki.uni-goettingen.de/
https://wikibase.world/wiki/Project:Home
Если сделаете pull request, постараюсь принять.
Знание – людям!
Я убежден в том, что возможности оригинальных Вики-сервисов (Wikipedia, Wikidata и др.) следует изучать прежде всего для того, чтобы знать “как оно может быть”. Надеюсь, что после ознакомления с перечисленными в данном материале возможностями Вики-сервисов, читатели смогут по-новому взглянуть на практическую ценность любых других онлайн-ресурсов (особенно тех, которыми предлагается импортозамещать Wikipedia).