Архив по категории: Работы студентов (просмотр)

Окт 15

Алгоритм кластеризации K-means

формула 2.1

Введение В этой главе мы описываем алгоритм k-means, простой и широко используемый алгоритм кластеризации. При данном множестве объектов (записей), цель  кластеризации  или сегментации  состоит в том, чтобы разделить эти объекты на группы или «кластеры» такие, что объекты внутри группы имеют тенденцию быть более похожими друг на друга по сравнению с объектами, принадлежащими различным группам. Другими …

Читать далее »

Окт 15

Алгоритм классификации “Classification and Regression Tree”

CART (сокращение от Classification And Regression Tree) переводится как «Дерево Классификации и Регрессии» — алгоритм бинарного дерева решений, впервые опубликованный Бриманом и др. в 1984 году. Алгоритм предназначен для решения задач классификации и регрессии. Основные отличия алгоритма CART заключены в следующих представлениях, функциях и механизмах:  бинарном представлении дерева решений;  функции оценки качества разбиения; …

Читать далее »

Окт 14

Реализация и распараллеливание алгоритма интеллектуального анализа данных, основанного на деревьях решений.

Е.С.Лепшова Тверской государственный университет Аннотация Данная статья содержит 9 страниц, 1 рисунок, список литературы (8 используемых источников). Структура работы представлена введением, 5 разделами, выводами, списком используемой литературы. Областью исследования является алгоритм, основанный на деревьях решений и дальнейшее его использование для решения задач классификации и интеллектуального анализа данных с выявлением скрытых знаний. Целью работы является повышение …

Читать далее »

Июль 11

Обзор методов Data Mining

Стремительное развитие информационных технологий, в частности, прогресс в методах сбора, хранения и обработки данных позволил многим организациям собирать огромные массивы данных, которые необходимо анализировать. Объемы этих данных настолько велики, что возможностей экспертов уже не хватает. На сегодняшний день интенсивно развивается направление, связанное с интеллектуализацией методов обработки и анализа данных. Интеллектуальные системы анализа данных (ИСАД) призваны …

Читать далее »

Июнь 02

Алгоритм Page Rank

google-pagerank-explained

PageRank был представлен и опубликован Сергеем Брином (Sergey Brin) и Ларри Пейджем (Larry Page) на седьмой международной конференции World Wide Web (WWW7) в апреле 1998 года. Это поисковый алгоритм ранжирования с использованием гиперссылок в Интернете. На основе алгоритма, они построили поисковую систему Google, которая получила большой успех и на данный момент в России является одним в этой области. Сейчас поисковые системы (Яндекс, Mail — близкие российскому сегменту интернета) …

Читать далее »