Нанотехнологическое сообщество Нанометр, все о нанотехнологиях
на первую страницу Новости Публикации Библиотека Галерея Сообщество Объявления Олимпиада ABC О проекте
 
  регистрация
помощь
 
Новая научная библиотека ищет нужные статьи с помощью искусственного интеллекта
(фото с сайта creativecommons.org).

Орен Эциони, главный исполнительный директор Института искусственного интеллекта Аллена
Новая научная библиотека ищет нужные статьи с помощью искусственного интеллекта
(иллюстрация Вести.Наука/сайт semanticscholar.org).

Пример результатов выдачи по ключевой фразе semantic analysis
(от ред.) Пример результатов выдачи по ключевому слову Graphene

Semantic Scholar - новая научная библиотека на основе искусственного интеллекта

Ключевые слова:  Nature, Semantic Scholar, Искусственный интеллект, Научная библиотека, периодика

Опубликовал(а):  Доронин Федор Александрович

15 ноября 2015

Онлайн-библиотеки начали появляться в 70-х годах прошлого столетия и с тех пор законно вошли в число изобретений человечества, про которые можно сказать "как мы жили без них раньше". С помощью электронных баз данных научных публикаций (таких как Google Scholar, MEDLINE, Cochrane Library и других) учёные легко ориентируются в архивах научной литературы, собирают и анализируют информацию, которая необходима для проведения новых исследований. Из стен традиционных библиотек наука вышла на новый прогрессивный уровень академических коммуникаций.

Сегодня, в эпоху электронной революции, количество информации в Интернете растёт с молниеносной скоростью, и возможность автоматизировать её анализ могла бы быть очень полезна. Растёт и необходимость развития электронных библиотек.

Новый шаг в этом направлении сделали специалисты Института искусственного интеллекта Аллена (AI2).

В ноябре программисты Института запустили новую поисковую систему Semantic Scholar (можно перевести как "Семантический учёный"). Он выполняет привычную для учёных роль архива научных данных и при этом может выдавать в ответ на запросы список публикаций по заданным ключевым фразам. Создатели отмечают, что этот ресурс обладает свойствами искусственного интеллекта, а потому значительно расширит возможности традиционных онлайн-библиотек.

Так, одной из выдающихся черт сайта Semantic Scholar, отличающих его от "собратьев", является возможность семантического понимания данных. Это означает, что поисковый алгоритм может извлекать из статьи различные элементы, такие как ключевые слова и фразы, ссылки, цитаты и другую информацию, анализировать связи между элементами текста и оценивать значимость смысла фразы, выдавая пользователю наиболее точную и полезную информацию.

Поисковая система Semantic Scholar имеет сдержанный дизайн, традиционный для академических ресурсов. Помимо стандартных инструментов она оснащена новым для научных поисковиков окном поиска по ключевым словам и фразам (Key Phrase), встречающимся в текстах статьей. При клике на ключевую фразу на экран выводится список статей, в которых, согласно семантическому анализу, эта фраза играет ключевую роль.

Например, когда человек вводит в окно поиска по ключевым фразам слова "семантический анализ" (semantic analysis, см. иллюстрацию выше), система находит статьи, посвящённые семантическому анализу. В левой части сайта выводится список релевантной информации, в том числе ключевых фраз, логически связанных с тематикой запроса — Semantic Similarity (семантическое сходство), LSA (Latent Semantic Analysis — латентно-семантический анализ) и другие. То есть пользователь может оперативно получить большое количество данных, важных для изучаемой темы и освещающих разные её аспекты.

Орен Эциони (Oren Etzioni), главный исполнительный директор Института Аллена, считает, что новый сервис будет высоко оценён пользователями научных онлайн-библиотек за удобство и глубокое "понимание смысла" статей.

База данных Semantic Scholar уже содержит более трёх миллионов публикаций на тему компьютерных технологий, и пользоваться ей можно совершенно бесплатно. Читатель также имеет доступ к полной версии материалов с возможностью скачивания их в формате PDF. В течение года, как утверждают авторы проекта, база данных будет пополняться материалами других тематик.

Разработчики проекта уверены в успехе нового ресурса, несмотря на наличие у него крупных конкурентов. В частности, гиганта среди академических поисковиков Google Scholar, базы данных которого охватывают более 100 миллионов документов. Тем не менее он не совершенен. Питер Джаско (Péter Jacsó), учёный, занимающийся исследованиями технологий поисковых машин в Гавайском Университете в Маноа, проанализировал эффективность работы Google Scholar в 2009 году и обнаружил ряд ошибок в результатах поиска. Например, отмечает Джаско, система могла "не осмысленно" процитировать не релевантные запросу публикации, придать слову "Оглавление" смысл ключевой фразы или принять номер страницы документа за год выхода статьи.

Исследователь считает, что, несмотря на то, что Google Scholar имеет доступ к большому количеству данных, технологически подобным системам ещё есть куда расти. Действительно, как замечает Орен Эциони, запрограммировать электронную систему на выполнение "интеллектуальных" действий технически не просто.

Сервис Semantic Scholar находит более 80% научных документов в свободном доступе в Интернете, в том числе материалов веб-сайтов или итогов конференций в записях академических институтов.

Внедрив новый сервис, команда Института Аллена развивает идею использования искусственного интеллекта в повседневной жизни интернет-пользователя. Так, в разработке у исследователей также находится программное обеспечение для "осмысленного" поиска данных в социальной сети Twitter. Поскольку поиск по хэштегам не всегда даёт убедительные результаты (из-за многочисленных опечаток или индивидуальных вариаций написания хэштегов), учёные AI2 работают над технологией анализа смысла непосредственно текстов записей, что позволит сделать результаты поиска более точными.

Результаты исследования по разработке Semantic Scholar были опубликованы в журнале Nature.


Источник: Вести. Наука




Для того чтобы оставить комментарий или оценить данную публикацию Вам необходимо войти на сайт под своим логином и паролем. Зарегистрироваться можно здесь

 

Доменная паутина
Доменная паутина

Наносистемы: физика, химия, математика (2024, Т. 15, № 1)
Опубликован новый номер журнала "Наносистемы: физика, химия, математика". Ознакомиться с его содержанием, а также скачать необходимые Вам статьи можно по адресу: http://nanojournal.ifmo.ru/articles/volume15/15-1
Там же можно скачать номер журнала целиком.

Наносистемы: физика, химия, математика (2023, Т. 14, № 5)
Опубликован новый номер журнала "Наносистемы: физика, химия, математика". Ознакомиться с его содержанием, а также скачать необходимые Вам статьи можно по адресу: http://nanojournal.ifmo.ru/articles/volume14/14-5
Там же можно скачать номер журнала целиком.

Наносистемы: физика, химия, математика (2023, Т. 14, № 4)
Опубликован новый номер журнала "Наносистемы: физика, химия, математика". Ознакомиться с его содержанием, а также скачать необходимые Вам статьи можно по адресу: http://nanojournal.ifmo.ru/articles/volume14/14-4
Там же можно скачать номер журнала целиком.

Материалы к защитам магистерских квалификационных работ на ФНМ МГУ в 2023 году
коллектив авторов
30 мая - 01 июня пройдут защиты магистерских квалификационных работ выпускниками Факультета наук о материалах МГУ имени М.В.Ломоносова.

Материалы к защитам выпускных квалификационных работ бакалавров ФНМ МГУ 2022
Коллектив авторов
Материалы к защитам выпускных квалификационных работ бакалавров ФНМ МГУ 2022 содержат следующую информацию:
• Подготовка бакалавров на факультете наук о материалах МГУ
• Состав Государственной Экзаменационной Комиссии
• Расписание защит выпускных квалификационных работ бакалавров
• Аннотации квалификационных работ бакалавров

Эра технопредпринимательства

В эпоху коронавируса и борьбы с ним в существенной степени меняется парадигма выполнения творческих работ и ведения бизнеса, в той или иной мере касаясь привлечения новых типов дистанционного взаимодействия, использования виртуальной реальности и элементов искусственного интеллекта, продвинутого сетевого маркетинга, использования современных информационных технологий и инновационных подходов. В этих условиях важным является, насколько само общество готово к использованию этих новых технологий и как оно их воспринимает. Данной проблеме и посвящен этот небольшой опрос, мы будет рады, если Вы уделите ему пару минут и ответите на наши вопросы.

Технопредпринимательство в эпоху COVID-19

Небольшой опрос о том, как изменились подходы современного предпринимательства в контексте новых и возникающих форм ведения бизнеса, онлайн образования, дистанционных форм взаимодействия и коворкинга в эпоху пандемии COVID - 19.

Технонано

Технопредпринимательство - идея, которая принесет свои плоды при бережном культивировании и взращивании. И наша наноолимпиада, и Наноград от Школьной Лиги РОСНАНО, и проект Стемфорд, и другие замечательные инициативы - важные шаги на пути реализации этой и других идей, связанных с развитием новых высоких технологий в нашей стране и привлечением молодых талантов в эту вполне стратегическую область. Ниже приведен небольшой опрос, который позволит и нам, и вам понять, а что все же значит этот модный термин, и какова его суть.



 
Сайт создан в 2006 году совместными усилиями группы сотрудников и выпускников ФНМ МГУ.
Сайт модернизирован для ресурсной поддержки проектной деятельности учащихся в рамках ГК 16.647.12.2059 (МОН РФ)
Частичное или полное копирование материалов сайта возможно. Но прежде чем это делать ознакомьтесь с инструкцией.