Морфологические анализаторы (морфологизаторы) на php и других языках существуют уже достаточно давно и в большом количестве, позволяя реализовать поиск с учетом словоформ. Неотвратимый изъян анализатора - привязка к словарю, но некоторые более продвинутые скрипты могут работать и без словаря эвристическим способом, основываясь на вероятностных методах. Анализаторы сделаны как парсеры и стеммеры. (далее…)
Проблемы семантики и определение темы как отдельной страницы, так и сайта в целом стоит весьма остро и требует не то, чтоб отдельной статьи, а даже отдельной категории для выявления всех проблем существующих алгоритмов, ибо не найдено ни одного достойного ресурса, отвечающего всем техническим требованиям. (далее…)
Для того, чтоб машина могла думать, составлять правильно (грамотно и логично) и красиво (стиллизованно) предложения, помимо того, что адекватно (в тему) отвечать, ей нужен "кругозор", т.е. база данных (БД). Ведь, если человек не знает слов, например, строительных слов (ригель - балка), то как человек сможет поддерживать разговор и тем более его вести? - робот аналогично, AI даже не сможет определить тему разговора и время - будущее, прошлое или настоящее. (далее…)
Конечно, просто создать БД - это одна проблема, но ее нужно не просто создать, а создать правильно, т.е. откорректировать так, чтобы она отвечала действительности, чтоб предлоги "перед", "под", и т.д. робот с искусственным интеллектом мог различить, например, с существительным, написанным случайно (по ошибке) раздельными словами, например, "под земка" и не включал их в свою базу, или, обработав, удалил, оставив только конечный результат. Иначе получится два неправильных (не существующих слова), которые в дальнейшем будут только засорять БД и уменьшать вероятность "понимания" языка роботом, а также замедлять его роботу в связи с накопившемся мусором в БД. (далее…)
Падежи - это полбеды, нужно также заложить в программу AI правильные окончания и приставки, чтобы он знал как правильно формируются слова и мог их составлять грамматически правильно. Но и это еще не все, ведь мы не хотим заранее, чтобы AI отвечал тупо шаблонами, он должен сам определять о чем речь и в зависимости от конкретной ситуации самостоятельно выбирать правильный ответ / вопрос. О ситуации - тоже нужно в отдельной статье рассмотреть различного рода ситуации и соответственную ответную реакцию AI, ведь было бы весьма странно, если бы на вопрос "Как дела, чувак, блин?" наш AI ответил бы "Хорошо, а как твои, Ваня?" или "Сегодня, сэр, не плохо!" вместо "Круто, внатуре, чувак, а ты чем паришься?" - чувствуете стиль, характер и непредсказуемость машины? (далее…)
Помимо правильной и грамотной расстановки слов, AI также должен уметь анализировать предложения, как отдельные единицы БД, работать с ними примерно так же, как со словами, используя массу свойств технических и логических, а также и правила самого языка.
Кто-то задастся вопросом, а зачем AI уметь классифицировать и парсить (анализировать) предложения в купе - абзатцы, ведь на это потребуется сумасшедшие вычисления, сотни, а то и тысячи запросов в БД, стоит ли оно того? (далее…)
Например, на вопрос "Как дела?", человек сразу не задумываясь ответит хорошо или плохо, но роботу будет не понятно к кому обращаются и следуя логике, он спросит, - "У кого дела?", "Где дела?", а также "Какие дела?" и будет вполне прав. Также можно спросить "Как твои дела?" или "Как у тебя дела?" и поставить робота в тупик. (далее…)
Рекламный блок РБ3 (360x60 или 125х125 пх). Здесь может быть Ваша реклама (текст, ссылки, баннеры) -
сквозная прямая ссылка на всех страницах всего за 40 $/мес.
Подробности по размещению рекламы в блоге Остров МЫСЛЕЙ:
463768885,
zgr@bk.ru...
Блогер-сеошник, веду сайты:
Остров ПОЭЗЫ,
Остров УСЛУГ,
Остров ЛИТЕРАТУРЫ.
Это техническая страница, более подробно обо мне смотрите здесь.Также приглашаю заглянуть в раздел
О блоге и посетить
личный блог.