Нанотехнологическое сообщество Нанометр, все о нанотехнологиях
на первую страницу Новости Публикации Библиотека Галерея Сообщество Объявления Олимпиада ABC О проекте
 
  регистрация
помощь
 
Новая научная библиотека ищет нужные статьи с помощью искусственного интеллекта
(фото с сайта creativecommons.org).

Орен Эциони, главный исполнительный директор Института искусственного интеллекта Аллена
Новая научная библиотека ищет нужные статьи с помощью искусственного интеллекта
(иллюстрация Вести.Наука/сайт semanticscholar.org).

Пример результатов выдачи по ключевой фразе semantic analysis
(от ред.) Пример результатов выдачи по ключевому слову Graphene

Semantic Scholar - новая научная библиотека на основе искусственного интеллекта

Ключевые слова:  Nature, Semantic Scholar, Искусственный интеллект, Научная библиотека, периодика

Опубликовал(а):  Доронин Федор Александрович

15 ноября 2015

Онлайн-библиотеки начали появляться в 70-х годах прошлого столетия и с тех пор законно вошли в число изобретений человечества, про которые можно сказать "как мы жили без них раньше". С помощью электронных баз данных научных публикаций (таких как Google Scholar, MEDLINE, Cochrane Library и других) учёные легко ориентируются в архивах научной литературы, собирают и анализируют информацию, которая необходима для проведения новых исследований. Из стен традиционных библиотек наука вышла на новый прогрессивный уровень академических коммуникаций.

Сегодня, в эпоху электронной революции, количество информации в Интернете растёт с молниеносной скоростью, и возможность автоматизировать её анализ могла бы быть очень полезна. Растёт и необходимость развития электронных библиотек.

Новый шаг в этом направлении сделали специалисты Института искусственного интеллекта Аллена (AI2).

В ноябре программисты Института запустили новую поисковую систему Semantic Scholar (можно перевести как "Семантический учёный"). Он выполняет привычную для учёных роль архива научных данных и при этом может выдавать в ответ на запросы список публикаций по заданным ключевым фразам. Создатели отмечают, что этот ресурс обладает свойствами искусственного интеллекта, а потому значительно расширит возможности традиционных онлайн-библиотек.

Так, одной из выдающихся черт сайта Semantic Scholar, отличающих его от "собратьев", является возможность семантического понимания данных. Это означает, что поисковый алгоритм может извлекать из статьи различные элементы, такие как ключевые слова и фразы, ссылки, цитаты и другую информацию, анализировать связи между элементами текста и оценивать значимость смысла фразы, выдавая пользователю наиболее точную и полезную информацию.

Поисковая система Semantic Scholar имеет сдержанный дизайн, традиционный для академических ресурсов. Помимо стандартных инструментов она оснащена новым для научных поисковиков окном поиска по ключевым словам и фразам (Key Phrase), встречающимся в текстах статьей. При клике на ключевую фразу на экран выводится список статей, в которых, согласно семантическому анализу, эта фраза играет ключевую роль.

Например, когда человек вводит в окно поиска по ключевым фразам слова "семантический анализ" (semantic analysis, см. иллюстрацию выше), система находит статьи, посвящённые семантическому анализу. В левой части сайта выводится список релевантной информации, в том числе ключевых фраз, логически связанных с тематикой запроса — Semantic Similarity (семантическое сходство), LSA (Latent Semantic Analysis — латентно-семантический анализ) и другие. То есть пользователь может оперативно получить большое количество данных, важных для изучаемой темы и освещающих разные её аспекты.

Орен Эциони (Oren Etzioni), главный исполнительный директор Института Аллена, считает, что новый сервис будет высоко оценён пользователями научных онлайн-библиотек за удобство и глубокое "понимание смысла" статей.

База данных Semantic Scholar уже содержит более трёх миллионов публикаций на тему компьютерных технологий, и пользоваться ей можно совершенно бесплатно. Читатель также имеет доступ к полной версии материалов с возможностью скачивания их в формате PDF. В течение года, как утверждают авторы проекта, база данных будет пополняться материалами других тематик.

Разработчики проекта уверены в успехе нового ресурса, несмотря на наличие у него крупных конкурентов. В частности, гиганта среди академических поисковиков Google Scholar, базы данных которого охватывают более 100 миллионов документов. Тем не менее он не совершенен. Питер Джаско (Péter Jacsó), учёный, занимающийся исследованиями технологий поисковых машин в Гавайском Университете в Маноа, проанализировал эффективность работы Google Scholar в 2009 году и обнаружил ряд ошибок в результатах поиска. Например, отмечает Джаско, система могла "не осмысленно" процитировать не релевантные запросу публикации, придать слову "Оглавление" смысл ключевой фразы или принять номер страницы документа за год выхода статьи.

Исследователь считает, что, несмотря на то, что Google Scholar имеет доступ к большому количеству данных, технологически подобным системам ещё есть куда расти. Действительно, как замечает Орен Эциони, запрограммировать электронную систему на выполнение "интеллектуальных" действий технически не просто.

Сервис Semantic Scholar находит более 80% научных документов в свободном доступе в Интернете, в том числе материалов веб-сайтов или итогов конференций в записях академических институтов.

Внедрив новый сервис, команда Института Аллена развивает идею использования искусственного интеллекта в повседневной жизни интернет-пользователя. Так, в разработке у исследователей также находится программное обеспечение для "осмысленного" поиска данных в социальной сети Twitter. Поскольку поиск по хэштегам не всегда даёт убедительные результаты (из-за многочисленных опечаток или индивидуальных вариаций написания хэштегов), учёные AI2 работают над технологией анализа смысла непосредственно текстов записей, что позволит сделать результаты поиска более точными.

Результаты исследования по разработке Semantic Scholar были опубликованы в журнале Nature.


Источник: Вести. Наука




Для того чтобы оставить комментарий или оценить данную публикацию Вам необходимо войти на сайт под своим логином и паролем. Зарегистрироваться можно здесь

 

День Святого Патрика (5)
День Святого Патрика (5)

MAPPIC 2019. Второй день
15 октября 2019 года прошел второй день I Московской осенней международной конференции по перовскитной фотовольтаике (Moscow Autumn Perovskite Photovoltaics International Conference – MAPPIC-2019). В сообщении приведены темы докладов и небольшой фоторепортаж.

MAPPIC 2019. Первый день
14 октября 2019 года успешно открылась I Московская осенняя международная конференция по перовскитной фотовольтаике (Moscow Autumn Perovskite Photovoltaics International Conference – MAPPIC-2019). В сообщении приведены темы докладов и небольшой фоторепортаж.

В Москве начинается MAPPIC - 2019
14-15 октября 2019 года состоится I Московская осенняя международная конференция по перовскитной фотовольтаике (Moscow Autumn Perovskite Photovoltaics International Conference – MAPPIC-2019)

Лекция про Дмитрия Ивановича и Наномир на Фестивале науки
Е.А.Гудилин и др., Фестиваль науки
В дни Фестиваля науки «NAUKA 0+» на Химическом факультете МГУ ведущие ученые познакомили слушателей с самыми современными достижениями химии. Ниже приводится небольшой фоторепортаж 1 дня и расписание лекций.

Как правильно заряжать аккумулятор?
Д. М. Иткис
Химик Даниил Иткис о том, как правильно заряжать аккумуляторы гаджетов и почему телефон выключается на холоде

Постлитийионные аккумуляторы
В. А. Кривченко
Физик Виктор Кривченко о перспективных видах аккумуляторов, фундаментальных проблемах в производстве литий-серных источников тока и преимуществах постлитийионных аккумуляторов

Технонано

Технопредпринимательство - идея, которая принесет свои плоды при бережном культивировании и взращивании. И наша наноолимпиада, и Наноград от Школьной Лиги РОСНАНО, и проект Стемфорд, и другие замечательные инициативы - важные шаги на пути реализации этой и других идей, связанных с развитием новых высоких технологий в нашей стране и привлечением молодых талантов в эту вполне стратегическую область. Ниже приведен небольшой опрос, который позволит и нам, и вам понять, а что все же значит этот модный термин, и какова его суть.

Технопредпринимательство на марше

Мы традиционно просим вас высказать свои краткие суждения по вопросу технопредпринимательства и проектной деятельности школьников. Для нас очевидно, что под технопредпринимательством и под проектной деятельностью школьников каждый понимает свое, но нам интересно ваше мнение, заодно вы сможете увидеть по мере прохождения опроса, насколько оно совпадает или отличается от мнения остальных. Ждем ваших ответов!

О наноолимпиаде замолвите слово...

Прошла XII Всероссийская олимпиада "Нанотехнологии - прорыв в Будущее!" Мы надеемся, что нам для улучшения организации последующих наноолимпиад поможет электронное анкетирование. Мы ждем Ваших замечаний, пожеланий, предложений. Спасибо заранее!



 
Сайт создан в 2006 году совместными усилиями группы сотрудников и выпускников ФНМ МГУ.
Сайт модернизирован для ресурсной поддержки проектной деятельности учащихся в рамках ГК 16.647.12.2059 (МОН РФ)
Частичное или полное копирование материалов сайта возможно. Но прежде чем это делать ознакомьтесь с инструкцией.