Menu
РАЗРАБОТКА ТЕКСТОВОЙ БАЗЫ НА ОСНОВЕ АНАЛИЗА СТРУКТУРЫ НАУЧНОГО ТЕКСТА
By: Анастасия Дыбина  (2906 reads)
Rating: (1.00/10)

Аннотация: В статье описан алгоритм построения текстовой базы, основанный на анализе структуры научного текста, понимаемого как связного, в терминах когезии и когерентности в рамках лингвистики текста. Исследования проводятся в области автоматического реферирования с целью построения интеллектуальной системы, основанной на глубинной семантике текста.

Ключевые слова: автоматическое реферирование, текстовая база, структура текста, связный текст, когезия, когерентность.

ACM Classification Keywords: E. Data, E.2 Data storage representation.

Link:

РАЗРАБОТКА ТЕКСТОВОЙ БАЗЫ НА ОСНОВЕ АНАЛИЗА СТРУКТУРЫ НАУЧНОГО ТЕКСТА

Анастасия Дыбина

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p11.pdf

СТРУКТУРИЗАЦИЯ ПРОСТРАНСТВА ФАКТОРОВ ДЛЯ УСТАНОВЛЕНИЯ ПРЕДВАРИТЕЛЬНОГО ...
By: Николай Маляр, Павел Мулеса  (3404 reads)
Rating: (1.00/10)

Abstract: При построении диагностических систем в медицине предлагается использовать структуризацию пространства факторов, влияющих на установление диагноза заболевания. Приводится пример структуризации для диагностирования мочекаменного заболевания в урологии.

Keywords: экспертная система; пространство факторов; классификация; стратификация; ранжирование; диагностические системы в медицине.

ACM Classification Keywords: H 1.1. Systems and Information Theory

Link:

СТРУКТУРИЗАЦИЯ ПРОСТРАНСТВА ФАКТОРОВ ДЛЯ УСТАНОВЛЕНИЯ ПРЕДВАРИТЕЛЬНОГО ДИАГНОЗА УРОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ

Николай Маляр, Павел Мулеса

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p10.pdf

НЕЧЕТКИЕ ПРОЦЕДУРЫ ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА ВАРИАНТОВ В КОМБИНАТОРНЫХ ...
By: Николай Маляр, Оксана Швалагин  (3424 reads)
Rating: (1.00/10)

Аннотация: Предлагаются нечеткие процедуры последовательного анализа вариантов в комбинаторных оптимизационных задачах с целью их использования для построения алгоритмов последовательного анализа, отсеивания и конструирования вариантов в условиях нечеткости. Описывается схема нечеткого алгоритма W последовательного анализа для дискретных задач математического программирования и ее приложения к нечеткой задаче классификации.

Ключевые слова: последовательный анализ вариантов, нечеткость, задача классификации.

ACM Classification Keywords: H.4.2 Information Systems Applications: Types of Systems: Decision Support.

Link:

НЕЧЕТКИЕ ПРОЦЕДУРЫ ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА ВАРИАНТОВ В КОМБИНАТОРНЫХ ОПТИМИЗАЦИОННЫХ ЗАДАЧАХ И ИХ ПРИМЕНЕНИЕ

Николай Маляр, Оксана Швалагин

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p09.pdf

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ АЛГОРИТМА ...
By: Павел П. Антосяк  (3106 reads)
Rating: (1.00/10)

Аннотация: В работе представлены результаты экспериментальных исследований эффективности процедур последовательного анализа вариантов для задачи линейного упорядочения альтернатив. Тестирование проводилось на реальных наборах данных (экономические таблицы «затратывыпуск» ряда европейских стран) и случайных наборах данных, полученных на основании равномерного распределения. Реализован сравнительный анализ с некоторыми приближенными алгоритмами.

Ключевые слова: задача линейного упорядочения альтернатив, последовательный анализ вариантов.

ACM Classification Keywords: H.4.2 Information Systems Applications: Types of Systems: Decision Support.

Link:

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ АЛГОРИТМА ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА ВАРИАНТОВ ДЛЯ ЗАДАЧИ ЛИНЕЙНОГО УПОРЯДОЧЕНИЯ АЛЬТЕРНАТИВ

Павел П. Антосяк

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p08.pdf

МУЛЬТИАГЕНТНЫЕ ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО УПРАВЛЕНИЯ В ТЕЛЕКОММУНИКАЦИОННЫХ СИ
By: Адиль Тимофеев   (2802 reads)
Rating: (1.00/10)

Аннотация: Рассматриваются проблемы и методы интеллектуального сетевого управления информационными потоками в мультиагентных телекоммуникационных системах и GRID-сетях. Значительное внимание уделяется принципам построения и оптимизации сетевых и нейросетевых агентов, обеспечивающих интеллектуальный анализ информационных потоков и адаптивное сетевое управление в условиях неопределённости в нечёткой среде.

Keywords: интеллектуальное управление, мультиагентные технологии, телекоммуникационные системы, GRID-сети.

ACM Classification Keywords: E.4 CODING AND INFORMATION THEORY

Link:

МУЛЬТИАГЕНТНЫЕ ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО УПРАВЛЕНИЯ В ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМАХ И GRID-СЕТЯХ

Адиль Тимофеев

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p07.pdf

АППРОКСИМАЦИЯ ФУНКЦИИ ЯРКОСТИ ОБЪЕКТА ПОЛУТОНОВОГО ИЗОБРАЖЕНИЯ
By: Калмыков et al.  (3623 reads)
Rating: (1.00/10)

Abstract The method, to encode the gray-scale image objects, is proposed, using canonical splines within the gray-scale image structural model. While the brightness values of object pixels are determined inside its contour, the approximation function is determined and built within rectangle which the object is circumscribed. Examples of the image encoding, initially set in a raster kind, are made.

Keywords: полутоновое изображение, контур, канонический сплайн.

ACM Classification Keywords: I.5.1 Models, I.3.5 Computational Geometry and Object Modeling.

Link:

АППРОКСИМАЦИЯ ФУНКЦИИ ЯРКОСТИ ОБЪЕКТА ПОЛУТОНОВОГО ИЗОБРАЖЕНИЯ

Владимир Калмыков, Виталий Вишневский, Татьяна Романенко, Татьяна Власова

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p06.pdf

УНИВЕРСАЛЬНАЯ СИСТЕМА ПРОГРАММ МОРФОЛОГИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ...
By: Надежда Мищенко  (3431 reads)
Rating: (1.00/10)

Abstract. This paper describes the software package FEST, which includes a universal program for morphological analysis of scientific and technical texts, MORPH, and several other programs generating data for MORPH. This data includes the morphological tables of a specific input language belonging to the permissible class of inflectional and agglutinative languages and a dictionary. The programs included in the FEST package generate the input language data for the MORPH program using formal descriptions of morphology and vocabularies created by a human expert who knows the language. The analysis strategy is based on an alternation of left-to-right and right-to-left analysis order. The dictionary of the input language contains stems rather than lexemes or word-forms, and consists of several dictionaries, each containing stems of the same length. The stems in the dictionary are accompanied by the grammar information, allowing all the word-forms of the input text to be recognized. The analysis strategy, the structure of the morphological tables and vocabularies enable morphological analysis of all word-forms with stems from dictionary.

Key words: the software package for morphological analysis, formal descriptions of morphology, formal descriptions of lexemes, morphological tables generation, vocabularies generation, results of morphological analysis (description and example).

ACM Classification Keywords: I.2.7. Natural Language Processing – Text analysis.

Link:

УНИВЕРСАЛЬНАЯ СИСТЕМА ПРОГРАММ МОРФОЛОГИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ НА ФЛЕКТИВНЫХ И АГГЛЮТИНАТИВНЫХ ЯЗЫКАХ

Надежда Мищенко

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p05.pdf

РЕФОРМА УКРАИСКОГО НАЦИОНАЛЬНОГО ОБРАЗОВАНИЯ, ОСНОВАННАЯ НА МЫШЛЕНИИ
By: Александр Сосницкий  (2824 reads)
Rating: (1.00/10)

Резюме: В статье рассматривается концепция новой модели системы украинского национального образования, основанной на развитии мышления, позволяющего получать дополнительные знание и понимание путем логического вывода. Обсуждаются четыре последовательно развивающиеся базовые компоненты модели: электронные технологии образования, электронная организация образования, мировые стандарты образования, технологии гениального воспитания и образования. Предлагаются способы реализации такой системы.

Ключевые слова: реформа образования, концепция системы национального образования, электронные технологии образования, мировые стандарты образования, технология гениального воспитания и образования.

ACM Classification Keywords: H.0 Information systems – General

Link:

РЕФОРМА УКРАИСКОГО НАЦИОНАЛЬНОГО ОБРАЗОВАНИЯ, ОСНОВАННАЯ НА МЫШЛЕНИИ

Александр Сосницкий

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p04.pdf

О ПРИМЕНЕНИЯ СИСТЕМОЛОГИЧЕСКОГО КЛАССИФИКАЦИОННОГО АНАЛИЗА ЗНАНИЙ ...
By: Екатерина Соловьева, Андрей Данилов  (2793 reads)
Rating: (1.00/10)

Аннотация: Знания являются главным ресурсом организации, государства, человека; основным фактором повышения их конкурентоспособности и устойчивого развития. В связи с увеличением спроса на знания, многие фирмы начинают все чаще использовать перспективные инструменты управления знаниями, например социальные сети. Рассматривается актуальная задача повышения эффективности функционирования социальных сетей на основе использования знаний и ноосферной системной методологии - системологии. С этой целью разработана модель (диаграммы: контекстная и 2-х уровней декомпозиции) процесса создания (выбора) и внедрения сайта социальной сети в организации. Важной составляющей частью этого процесса является систематизация знаний о той предметной области, для которой разрабатывается система функций нишевой социальной сети. Применение нового метода системологического классификационного анализа при систематизации знаний позволит: получить социальную сеть, наилучшим образом адаптированную для соответствующей предметной области, к потребностям конкретной организации; определить целесообразность использования различных функций в той или иной социальной сети. Это также позволит сделать систему функций адекватной, удобной и интуитивно понятной пользователю, за счет их содержательного размещения с учетом функционального назначения социальной сети. Приведен фрагмент базовой классификации функций социальных сетей, построенный на основе системологического классификационного анализа и реализованный в виде онтологии в программном средстве построения онтологий Protégé 3.2. Приведен фрагмент классификации договоров, использованной при создании эффективного меню социальной сети, а также его реализация в конструкторе построения социальной сети Tabba. Применение социальных сетей, адаптированных под требования пользователей, поможет компаниям существенно увеличить свой интеллектуальный капитал, без использования крупных инвестиций; позволит улучшить использование таких сетей для самосовершенствования и развития.

Ключевые слова: Системология, системологический классификационный анализ, классификация, социальная сеть, модель, бизнес-процес, знаниеориентированные технологии, Интернет.

Link:

О ПРИМЕНЕНИЯ СИСТЕМОЛОГИЧЕСКОГО КЛАССИФИКАЦИОННОГО АНАЛИЗА ЗНАНИЙ В ПРОЦЕССЕ ПОСТРОЕНИЯ НИШЕВЫХ СОЦИАЛЬНЫХ СЕТЕЙ.

Екатерина Соловьева, Андрей Данилов

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p03.pdf

ЦЕЛОСТНОСТЬ ОБРАЗОВ: О МОДЕЛИРОВАНИИ СМЫСЛА И ПОНИМАНИЯ
By: Юрий Валькман  (3520 reads)
Rating: (1.00/10)

Abstract: Анализируются свойства неполноты и целостности структур знаний в интеллектуальных системах. Рассматривается целостность знаний, представленных в вычислительной среде, с позиций определения их смыслов и понимания. Анализируются свойства категории смысла в приложении к образному мышлению. Исследование проводится с целью последующего построения формальных структур знаний для моделирования процессов образно-понятийного мышления в компьютерных технологиях.

Keywords: Образ, мышление, понимание, смысл, структура, система, целостность, модель, компьютерная технология, база знаний, вычислительная среда.

ACM Classification Keywords: A.1 Information Technology for Knowledge Management; Е.1 Process-oriented Knowledge Structuring; H.1.1 Systems and Information Theory; I.2.4 Knowledge Representation Formalisms and Methods; J.4 Social and Behavioral Sciences; М.4 Intelligence Metasynthesis and Knowledge Processing in Intelligent Systems.

Link:

ЦЕЛОСТНОСТЬ ОБРАЗОВ: О МОДЕЛИРОВАНИИ СМЫСЛА И ПОНИМАНИЯ

Юрий Валькман

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p02.pdf

К ВОПРОСУ ВИЗУАЛИЗАЦИИ ОНТОГРАФОВ ПРИ РАЗРАБОТКЕ ОНТОЛОГИЙ ПРЕДМЕТНЫХ ДИСЦИПЛИН
By: Палагин А.В., Петренко Н.Г., Величко В.Ю., Тихонов Ю.Л.   (3330 reads)
Rating: (1.00/10)

Аннотация. В работе описана методика, предназначенная для повышения эффективности графического представления и выразительности онтологий предметных дисциплин (ПдД). Предложена система индексации, ориентированная на машинное представление и обработку онтографа ПдД, и оригинальный инструментарий, реализующий информационную технологию построения онтологии ПдД и ее онтографа, электронных курсов обучения по различным ПдД. Интерфейс содержит всплывающие подсказки, в которые включено имя понятия и время, необходимое на изложение описания данного понятия, что поможет преподавателю выбрать конкретное содержание учебного курса в соответствии с ограничениями “Рабочей программы” ПдД. Приведен пример построения, визуализации и индексации онтографа ПдД “Базы данных” (БД).

Ключевые слова: онтологический инжиниринг, представление и обработку онтографа

ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms and Methods, K.3 COMPUTERS AND EDUCATION - K.3.1 Computer Uses in Education

Link:

К ВОПРОСУ ВИЗУАЛИЗАЦИИ ОНТОГРАФОВ ПРИ РАЗРАБОТКЕ ОНТОЛОГИЙ ПРЕДМЕТНЫХ ДИСЦИПЛИН БОЛЬШОГО ОБЪЕМА

Палагин А.В., Петренко Н.Г., Величко В.Ю., Тихонов Ю.Л.

http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p01.pdf

ПРОБЛЕМЫ СОВРЕМЕННОГО РЫНКА ЗНАНИЙ
By: Крассимир Марков  (4728 reads)
Rating: (1.00/10)

Аннотация: В статье рассматриваются некоторые проблемы, связанные с возникновением и развитием современного рынка знаний, который постепенно занимает основное место среди всех форм обмена знаниями.

Link:

ПРОБЛЕМЫ СОВРЕМЕННОГО РЫНКА ЗНАНИЙ

Крассимир Марков

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p04.pdf

СИСТЕМА ПРЕДОСТАВЛЕНИЯ ДИСТАНЦИОННЫХ УСЛУГ В ОБРАЗОВАНИИ ...
By: Востров Г.Н. et al.  (3176 reads)
Rating: (1.00/10)

Аннотация: В статье описываются модели управления распределенными информационными процессами в системе образования. Приводится описание системы поддержки on-line и off-line взаимодействия в сетевой среде, структуры сервера поддержки учебных взаимодействий как элемента интеллектуальной информационной среды учебного назначения.

Ключевые слова: дистанционные услуги в образовании, модель поддержки процессов коллективного взаимодействия, сервер поддержки учебных взаимодействий.

ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms and Methods.

Link:

СИСТЕМА ПРЕДОСТАВЛЕНИЯ ДИСТАНЦИОННЫХ УСЛУГ В ОБРАЗОВАНИИ – ХАРАКТЕРНЫЕ ТЕХНОЛОГИЧЕСКИЕ ОСОБЕННОСТИ

Востров Г.Н., Годынский М.Г., Кальной С.П., Лысенко М.И., Павлов О.А, Стрижак О.Е.

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p03.pdf

ИНСТРУМЕНТЫ ПОДДЕРЖКИ ПРОЦЕССОВ АНАЛИТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ ЭКСПЕРТА ...
By: А.В. Палагин, В.Ю. Величко, А.Е. Стрижак, М.А. Попова  (3169 reads)
Rating: (1.00/10)

Аннотация: В статье приведена обобщенная структура обеспечения доступа к распределенным информационным ресурсам. Описаны инструменты проведения контент-анализа документов на основе системно-онтологического подхода. Приведен пример использования инструментов экспертом-аналитиком при обработке тематических документов по проблеме изменения климата.

Ключевые слова: представление и обработка знаний, тематический анализ документов, поисковая система.

ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms and Methods,

Link:

ИНСТРУМЕНТЫ ПОДДЕРЖКИ ПРОЦЕССОВ АНАЛИТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ ЭКСПЕРТА ПРИ ТЕМАТИЧЕСКОМ ИССЛЕДОВАНИИ ИНФОРМАЦИОННЫХ РЕСУРСОВ И ИСТОЧНИКОВ

А.В. Палагин, В.Ю. Величко, А.Е. Стрижак, М.А. Попова

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p02.pdf

ОБНАРУЖЕНИЕ ЗНАНИЙ НА ОСНОВЕ СЕТЕВЫХ СТРУКТУР
By: Гладун В.П.   (3116 reads)
Rating: (1.00/10)

Аннотация: Рассматриваются требования к организации памяти интеллектуальных систем. Одновременно с вводом информации в памяти должны осуществляться процессы формирования ассоциативных связей, иерархического упорядочения, классификации, формирования понятий. Сформулированным требованиям удовлетворяют растущие пирамидальные сети (РПС). Обсуждаются достоинства РПС, приведены последние версии алгоритмов построения и обучения РПС, а также архитектура програмной системы поддержки принятия решений на основе сетевой модели предметной области. Многолетний опыт применения РПС для анализа данных и принятия решений в химии, материаловедении, технической диагностике подтверждает их достаточно высокие возможности.

Ключевые слова: представление и обработка знаний, растущие пирамидальные сети.

ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms and Methods

Link:

ОБНАРУЖЕНИЕ ЗНАНИЙ НА ОСНОВЕ СЕТЕВЫХ СТРУКТУР

Гладун В.П.

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p01.pdf

OPTIMISATION OF ROUTE-PLANNING UNDER INDEFINITE RISK CONDITIONS
By: Kuzemin Oleksandr, Berezhnoy Sergey, Dayub Yasir  (2985 reads)
Rating: (1.00/10)

Abstract: This paper describes an algorithm of data transformation with a view to provide support for the decision maker. The aim of the paper is to develop a multi-purpose algorithm of building sets of optimal routes, taking into consideration most of the real factors that provoke risks. A simple and effective method of multicriteria optimization was proposed and developed.

Keywords: emergency situations, microsituations, road conditions, weather conditions, objects of high danger, multicriteria optimisation.

ACM Classification Keywords: H.1 Models and Principles – General

Link:

OPTIMISATION OF ROUTE-PLANNING UNDER INDEFINITE RISK CONDITIONS

Kuzemin Oleksandr, Berezhnoy Sergey, Dayub Yasir

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p08.pdf

APPLICATION OF MATHEMATICAL INDUCTION FOR INHERITANCE LAW INERPRETATIONS
By: Assen Tochev, Vassil Guliashki  (3664 reads)
Rating: (1.00/10)

Abstract: The purpose of this article is to obtain simple rule for applying the Inheritance law for the case of (own) brothers/sisters by birth, and/or brothers/sisters uterine or through father. Using the mathematical induction a result is obtained for n (own) brothers/sisters by birth and m brothers/sisters uterine or through father.

Keywords: Inheritance law, mathematical induction.

ACM Classification Keywords: A.0 General Literature - Conference proceedings; I. Computing methodologies, I.2. Artificial Intelligence, I.2.1. Applications and expert systems, Subject descriptor: Law; H. Information systems, H4. Information systems application, H.4.2. Types of systems, Subject descriptor: Decision support;

Link:

APPLICATION OF MATHEMATICAL INDUCTION FOR INHERITANCE LAW INERPRETATIONS

Assen Tochev, Vassil Guliashki

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p07.pdf

MODEL RESEARCH OF INTERACTION PROCESSES OF TEXT SPACES
By: Konstantin I. Belousov, Tatyana N. Galinskaya  (2808 reads)
Rating: (1.00/10)

Abstract: The article discusses the problem of interaction of text spaces. When discussing the interaction of text spaces we assume that there exists a certain text model. The technique of semantic charting and the method of positional analysis allowed us to represent the successive-simultaneous semantic space of a text as its “semantic outline”. Owing to the method of the prosodic analysis of a text, aimed at modeling its prosodic outline, there appears the possibility to analyze the cooperative interactions of these relatively independent text spaces. The system-approached research program presented in the work is aimed at the study of the text as a polyontological, self-organizing spatiotemporal linguistic object. The multiaspect text analysis is grounded on a) the positional analysis method, b) quantitative methods which in there turn comprise such methods as c) correlation methods, which determine the text aspects’ level. By comparing and contrasting synchronically semantic connection intensity and mean sound intensity of the obtained data we received the results that allow us to be more specific in the discussion of the text structure as an evolving process. The search for explanatory tools of convergence, divergence, intersection, overlapping of various text structures is the key to understanding the complex material, ideal and social nature of text, its presentation as wholeness.

Keywords: system activity approach, modeling, positional analysis, semantic charts, semantic graph of a text.

Link:

MODEL RESEARCH OF INTERACTION PROCESSES OF TEXT SPACES

Konstantin I. Belousov, Tatyana N. Galinskaya

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p06.pdf

THE EXPERIENCE OF DEVELOPING SOFTWARE FOR TYPOLOGICAL DATABASES ...
By: Vladimir Polyakov  (3261 reads)
Rating: (1.00/10)

Abstract: In the present article we will discuss the experience of creating software for the typological database “Languages of the World”. The DB “Languages of the World” is one of the biggest typological computer resources. We have done a review of the software connected with the DB “Languages of the World”. The following questions are discussed: compatibility of the versions, choice of the best structure of the data, development of the content in newer versions of the DB, creation of bilingual version, correct citing. The main lessons learnt from the project by the workgroup, are: Long development and creation of different versions of the product during its life cycle (over 20 years), providing its livability against the background of changing of operational systems and paradigms of programming makes us seriously think about a technology of providing for compatibility between different versions of the product, documenting of the code, preserving the key participants of the workgroup. The structure of the DB is a secondary moment in the relation to the content. In the end, choice of a certain structure of data presentation in a certain realization of the product is a question of comfortable programming. Besides, choice of the structure of the data is in many situation defined by the environment of data storage, dates and budget of the product. Planning a long life cycle of a linguistic resource for scientific purposes must foresee tools of fixation and archiving the inevitable changes of the content. Lack of such tools or links to the contents without invariant binding lowers the quality and the value of the received scientific results. The creation of the bilingual version of the product demanded thorough elaboration of the terminological part of the DB, as well as linkage of the languages to the international system of coding. Along with it, the specificity of Russian scientific linguistic school and a more detailed description of the languages of Eurasia in the DB “Languages of the World” did not allow us to withdraw these contradictions completely. The main scientific results received for the past 5 years with the use of the DB, are enumerated. The perspectives of its future development and use are studied.

Keywords: language typology, linguistic database

Link:

THE EXPERIENCE OF DEVELOPING SOFTWARE FOR TYPOLOGICAL DATABASES (ON THE EXAMPLE OF DB “LANGUAGES OF THE WORLD”)

Vladimir Polyakov

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p05.pdf

ANALYZING THE LOCALIZATION OF LANGUAGE FEATURES WITH COMPLEX SYSTEMS TOOLS ...
By: Samuel F. Omlin  (3379 reads)
Rating: (1.00/10)

Abstract: Half of the world’s languages are in danger of disappearing before the century ends. Efficient protection of these languages is difficult as their fate depends on multiple factors. The role played by the geographic situation of a language in its survival is still unclear. The following quantitative study focused on the relation between the ‘vitality’ of a minority language and the linguistic structure of the neighboring languages. A large sample of languages in Eurasia was considered. The languages were described based on a complex system of typological features. The spatial distribution of the language features in the sample area was measured by quantifying deviations from purely random configurations. Interactions between the linguistic features were revealed. The obtained interaction network permitted to define a location “quality” index for a language localization. This index was put in relation to corresponding vitality estimations from Unesco. A significant relation could be established between these two variables. The degree of endangerment of the minority languages studied seems effectively related to the linguistic structure of their neighboring languages. Beyond the particular context of endangered languages, the proposed approach constitutes a promising tool to gain more knowledge about the mechanisms that control the geographical distribution of linguistic features.

Keywords: Language competition, Complex systems, Interactions, Spatial distribution, Typological language features.

ACM Classification Keywords: I.m Miscellaneous; J.5 Arts and Humanities – Linguistics; H.2.8 Database Applications – Data mining, Scientific databases, Spatial databases and GIS.

Link:

ANALYZING THE LOCALIZATION OF LANGUAGE FEATURES WITH COMPLEX SYSTEMS TOOLS AND PREDICTING LANGUAGE VITALITY

Samuel F. Omlin

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p04.pdf

COMPARATIVE ANALYSIS OF PHYLOGENIC ALGORITHMS
By: Valery Solovyev, Renat Faskhutdinov  (2824 reads)
Rating: (1.00/10)

Abstract The paper is dedicated to comparative analysis of phyogenetic algorithms used for linguistics tasks. At present there are a lot of phylogenetic algorithms; however, there is no unanimous opinion on which of them should be used. The paper suggests the model of language evolution trees and introduces a parameter to characterize the topology of trees. The comparison of the main algorithms is made on the trees of various topology. The paper displays that the UPGMA algorithm gives better results on the trees close to balanced ones. It provides the explanation for a number of contradictive results, described in published works. The problem of the input data choice and the relation between results and the number and type of parameters is under consideration. The results obtained are also ambiguous. Typological databases “Jazyki mira” and WALS as well as the method of computer modeling are used in the paper.

Keywords: language evolution, phylogenetic algorithms

Link:

COMPARATIVE ANALYSIS OF PHYLOGENIC ALGORITHMS

Valery Solovyev, Renat Faskhutdinov

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p03.pdf

SPAM AND PHISHING DETECTION IN VARIOUS LANGUAGES
By: Liana Ermakova  (3700 reads)
Rating: (1.00/10)

Abstract: The majority of existing spam filtering techniques suffers from several serious disadvantages. Some of them provide many false positives. The others are suitable only for email filtering and may not be used in IM and social networks. Therefore content methods seem to be more efficient. One of them is based on signature retrieval. However it is not change resistant. There are enhancements (e.g. checksums) but they are extremely time and resource consuming. That is why the main objective of this research is to develop a transforming message detection method. To this end we have compared spam in various languages, namely English, French, Russian and Italian. For each language the number of examined messages including spam and notspam was about 1000. 135 quantitative features have been retrieved. Almost all these features do not depend on the language. They underlie the first step of the algorithm based on support vector machine. The next stage is to test the obtained results applying trigram approach. Proposed phishing detection technique is also based on SVM. Quantitative characteristics, message structure and key words are used as features. The obtaining results indicate the efficiency of the suggested approach.

Keywords: spam, corpus linguistics, phishing, filtering, text categorization.

ACM Classification Keywords: I.2.7 Text analysis

Link:

SPAM AND PHISHING DETECTION IN VARIOUS LANGUAGES

Liana Ermakova

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p02.pdf

GRAMMATICAL PRIMING DOES FACILITATE VISUAL WORD NAMING, AT LEAST IN SERBIAN
By: Dejan Lalović  (3937 reads)
Rating: (1.00/10)

Abstract: Starting from the seminal work in 1980s to more recent findings, literature review suggests grammatical priming to be an elusive fenomenon, reliably obtained mostly in a lexical decision task and only rarely in naming task. Prevalent conclusion derived from the aforementioned fact suggests the effects of grammatical priming to be of less importance for online word processing as reflected by naming. However, this goes against intuitive notion of grammatical information being especially valuable in processing richly-inflected, free-word ordered language such as Serbian. The conclusion was challenged in a naming task in which prepositions and personal pronouns were employed to prime target nouns and verbs. We also tested the effect of prime-target asynchrony at 600ms and 250ms intervals, as the variable is known to invertly influence effects of language priming. Delayed naming condition was used to provide a purer estimate of target processing time afforded at the two asynchrony intervals in online naming. Analyses suggest effects of grammatical priming to be both substantial and robust. The facilitation of 22 ms (25 ms at 600 ms asynchrony, 20 ms at 250 ms asynchrony) provided by grammatical information was roughly twice as large as obtained in comparable studies in English. The facilitation effect was not qualified by interaction with SOA and therefore should not be attributed to some major strategic process associated with the longer SOA. We conclude grammatical priming in naming to be possible, at least in case of richly-inflected, free word-ordered language, and more than one word class primed. Online-delayed average latencies difference indicated slightly wider time window for target processing at the shorter asynchrony. The fact requires caution in grammatical priming effects loci interpretation.

Keywords: grammatical priming; word naming.

ACM Classification Keywords: I.2 Artificial Intelligence; I.2.7 Natural Language Processing – Language parsing and understanding.

Link:

GRAMMATICAL PRIMING DOES FACILITATE VISUAL WORD NAMING, AT LEAST IN SERBIAN

Dejan Lalović

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p01.pdf

MULTILINGUAL REDUCED N-GRAM MODELS
By: Tran Thi Thu Van and Le Quan Ha  (3208 reads)
Rating: (1.00/10)

Abstract: Statistical language models should improve as the size of the n-grams increases from 3 to 5 or higher. However, the number of parameters and calculations, and the storage requirement increase very rapidly if we attempt to store all possible combinations of n-grams. To avoid these problems, the reduced n-grams’ approach previously developed by O’Boyle? 1993 can be applied. A reduced n-gram language model can store an entire corpus’s phrase-history length within feasible storage limits. Another theoretical advantage of reduced n-grams is that they are closer to being semantically complete than traditional models, which include all n-grams. In our experiments, the reduced n-gram Zipf curves are first presented, and compared with conventional n-grams for all Irish, Chinese and English. The reduced n-gram model is then applied for large Irish, Chinese and English corpora. For Irish, we can reduce the model size, compared to the 7-gram traditional model size, with a factor of 15.1 for a 7-million-word Irish corpus while obtaining 41.63% improvement in perplexities; for English, we reduce the model sizes with factors of 14.6 for a 40-million-word corpus and 11.0 for a 500-million-word corpus while obtaining 5.8% and 4.2% perplexity improvements; and for Chinese, we gain a 16.9% perplexity reductions and we reduce the model size by a factor larger than 11.2. This paper is a step towards the modeling of Irish, Chinese and English using semantically complete phrases in an n-gram model.

Keywords: Reduced n-grams, Overlapping n-grams, Weighted average (WA) model, Katz back-off, Zipf’s law.

ACM Classification Keywords: I. Computing Methodologies - I.2 ARTIFICIAL INTELLIGENCE - I.2.7 Natural Language Processing - Speech recognition and synthesis

Link:

MULTILINGUAL REDUCED N-GRAM MODELS

Tran Thi Thu Van and Le Quan Ha

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-2-p07.pdf

THE ARGUMENT BASED COMPUTATION: SOLVING THE BINDING PROBLEM
By: Alona Soschen, Velina Slavova  (3094 reads)
Rating: (1.00/10)

Abstract: In this paper, we further developed the argument-based model of syntactic operations that is argued to represent the key to basic mental representations. This work concentrates on formal descriptions of the observed syntax-semantics dependencies. We briefly review our up do date experimental work designed to test this hypothesis, and offer the results of our most recent experiment. The results of our experiments confirmed that semantic relations between the images in conceptual nets influence syntactic computation. The binding problem that arises when the same noun can be represented either as Subject (ex. The cat chases the mouse) or Object (ex. The mouse chases the cat Introduction ), was successfully resolved.

Keywords: Cognitive Models of Language Phenomena, Formal Models in Language and Cognition, Psycholinguistics and Psycho semantics

ACM Classification Keywords: ACM Classification Keywords: I.2 Artificial Intelligence, 1.2.0. Cognitive simulation

Link:

THE ARGUMENT BASED COMPUTATION: SOLVING THE BINDING PROBLEM

Alona Soschen, Velina Slavova

http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-2-p06.pdf

[prev]  Page: 10/66  [next]
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66 
World Clock
Powered by Tikiwiki Powered by PHP Powered by Smarty Powered by ADOdb Made with CSS Powered by RDF powered by The PHP Layers Menu System
RSS Wiki RSS Blogs rss Articles RSS Image Galleries RSS File Galleries RSS Forums RSS Maps rss Calendars
[ Execution time: 0.15 secs ]   [ Memory usage: 7.57MB ]   [ GZIP Disabled ]   [ Server load: 0.19 ]