Шпаргалки по информационным техологиям

Описание:
Системы автоматического аннотирования и реферирования текста. Типы систем МП. Классификация ПК. Классификация ОС.
Доступные действия
Введите защитный код для скачивания файла и нажмите "Скачать файл"
Защитный код
Введите защитный код

Нажмите на изображение для генерации защитного кода

Текст:

Вопрос 1.

ИТ – совокупность методов, процессов и программно-технических средств, интегрированных с целью сбора, обработки, хранения, распространения и использования информации в интересах пользователя.

Телекоммуникации – средства, позволяющие вести обмен информацией на большие расстояния.

ИТТ (информационные и телекоммуникационные технологии) – технологии, возникшие  результате сочетания возможностей ПК и телекоммуникационной техники передавать данные на расстояния.

История развития ПК:

1) І этап: с момента возникновения человеческого общества до первой половины ХІХ века – «ручная» ИТ. Инструментарий: перо, чернила, коммуникации осуществлялись ручным способом путём передачи писем, посылок.

2) ІІ этап: вторая половина ХІХ века – техническая революция, механическая ИТ. Инструментарий: пишущая машинка, телефон, телеграф, радио.

3) ІІІ этап: 40-60-е года ХХ века – электрическая ИТ. Инструментарий: большие ЭВМ, электрические пишущие машинки, портативные магнитофоны.

4) ІV этап: начало 70-х – середина 80-х XX века – электронная ИТ. Инструментарий: большие ЭВМ и созданные на их основе автоматические системы управления (АСУ).

5) V этап: середина 80-х – наши дни – новая компьютерная технология. Инструментарий: ПК и компьютерные сети. Создаются ИТ, имеющие встроенные элементы анализа и ИИ.

Причины создания ИТ:

1)  технические достижения:

а)    появление высокоскоростных ПК с большой внешней и внутренней памятью;

б)    изобретения межсистемных интерфейсов и процессоров, способных работать в сети;

в)    разработка телекоммуникационных сетей, способных с большой скоростью производить пакетную передачу данных;

г) разработка звуковых и видеоплат, позволяющих обрабатывать мультимедийную информацию;

д)    создание мультимедиапроцессоров (мультимедийных);

е)    разработка устройств электронной связи (модемов) позволяющих передавать информацию на большие расстояния;

ж)   изобретение способов факсимильной передачи информации на расстояния (факс);

з)    появление электронной оргтехники: сканеров, принтеров и т.д.

2)  программное обеспечение:

а)    новые системные и инструментальные средства:

-    сетевые операционные системы, программы-оболочки, утилиты, драйверы;

-    новые системы программирования;

б)    прикладные программы обработки информации: информационно-поисковые системы, системы автоматического аннотирования, реферирования и индексирования текста, системы машинного перевода, экспертные системы, системы ИИ, естественно-языковые системы обучения, системы распознавания речи, системы автоматического чтения текста;

в)    автоматизированные рабочие места специалистов (АРМ);

г) системы управления документооборотами (MS Word).

3)  информационное обеспечение:

а)    создание баз и банков данных и знаний;

б)    СУБД (системы управления базами данных);

в)    Электронные хранилища информации (электронные справочники и словари);

г) Интернет;

д)    E-mail.


Вопрос 2.

Цель создания современных ИТ:

1) Максимальная информатизация и компьютеризация современного общества, обеспечивающая значительный рост производительности труда;

2) Максимальное удовлетворение информационных запросов всех членов общества;

3) Непрерывное повышение знаний, умений и навыков работы самым современным оборудование, техническим обеспечением фирм, офисов.

Основные черты:

1) Компьютерные технологии, в основе которых лежит ПК, обеспечивают электронные процессы обработки данных;

2) Безбумажные технологии;

3) Доступность;

4) Интерактивно-диалоговый режим обмена информацией;

5) Альтернативность, возможность выбора наиболее рациональный ИТ на основе нескольких аналогичных;

6) Формализованность – возможность приведения информационных процессов к абстрактному виду и их записи на машинных языках;

7) Открытость – возможность введения в информационные системы новых элементов;

8) Безопасность (малое напряжение).

Примеры ИТ:

1)  В лингвистике:

а)    Автоматическое создание словаря, слов, текстов какого-либо автора;

б)    Автоматическое определение значения многозначного слова;

в)    Автоматический синтаксический анализ предложения;

г) Автоматическое индексирование текста (определение основного содержания);

д)    Автоматическое составление реферата, аннотирование текста, автоматическое чтение и распознавание текста, перевод, автоматическое построение (порождение) нового текста;

е)    Понимание текста, сказанного вслух;

ж)   Синтез речи;

з)    Определение автора неизвестного текста.

2)  В обучении языка:

а)    Автоматические обучающие системы, в рамках которых разрабатывается большое количество мультимедийных обучающий программ;

б)    Дистанционное обучение с помощью интернета: существует большое количество серверов от разных организаций, позволяющих по сети передавать заданные учебные материалы и в интерактивном режиме вести опрос;

в)    Использование словарей, энциклопедий, электронных учебников.


Вопрос 3.

ИТ – совокупность методов, процессов и программно-технических средств, интегрированных с целью сбора, обработки, хранения, распространения и использования информации в интересах пользователя.

Структура ИТ:

1)  Теоретические основы ИТ;

2)  Метод решения задач (моделирование);

3)  Средства решения задач:

а)    Аппаратные;

б)    Программные.

Теоретическую основу ИТ составляют важнейшие понятия и законы информатики.

Информатика – наука о законах и методах получения, хранения, передачи, распространения и использования информации в естественных и искусственных системах с помощью ЭВМ.

Информация – определённым образом связанные сведения, понятия, отражённые в нашем сознании и изменяющие наше представление о мире; отражение реального мира с помощью различных сообщений.

Сообщение – форма представления информации в различных видах (текста, речи, изображения, цифровых данных, схем, графиков, таблиц).

Данные – результат наблюдения над объектом, явлением, которые по каким-то причинам не используются, а только хранятся. Когда данные используются в практических целях, они превращаются в информацию.

Свойства информации:

Актуальность; Достоверность; Ценность; Полнота; Логичность; Компактность. Защищенность; Доступность.

Виды информации:

1)  По отношению к окружающей среде:

а)    Входная (которую система воспринимает от окружающей среды);

б)    Выходная (которую система выдаёт в окружающую среду);

в)    Внутренняя или внутрисистемная (хранится, перерабатывается и используется только внутри системы);

2)  По изменчивости: Постоянная; Переменная; Смешанная;

3)  По восприятию органами чувств: Визуальная; Аудиальная; Аудиовизуальная; Тактильная;

4)  По направленности:

а)    Массовая;

б)    Специальная: научная, техническая.

Лингвистическая информация – множество определённым образом связанных сведений, данных, понятий о языке и правилах его функционирования.

Лингвистическая информатика – наука о законах и методах организации и переработки лингвистической информации с помощью ПК.

Методы получения и использования информации:

1)  Эмпирические (полученные опытным путём) -  наблюдение, сравнение, измерение, эксперимент, интервью, тестирование, опрос;

2)  Теоретические (теории, гипотезы) – восхождение от абстрактного к конкретному (получение знаний о системе на основе знаний о её проявлениях в сознании, мышлении человека), формализация (получение знаний о системе с помощью формул, знаков), виртуализация (создание искусственной среды).

3)  Эмпирико-теоретические – абстрагирование (замена системы её моделью), анализ (разъединение системы на подсистемы), синтез (соединение подсистем в системы), индукция (от частного к общему, т.е. познание системы с помощью подсистемы), дедукция (от общего к частному), эвристика (знания по наблюдению, опыту), моделирование (использование приборов), исторический метод (знания с учётом предыстории системы), визуализация (уменьшение, поворот, удаление), мониторинг.


Вопрос 4.

ИП могут протекать не только в человеческом обществе но и в растительном и животном мире.

Информационный процесс – процесс, в результате которого осуществляется приём, передача, переработка и использование информации.

Система – любой объект, который одновременно рассматривается как единое целое и как совокупность разнородных (разнообразных) объектов, объединённых для достижения определённого результата.

Информационная система – совокупность взаимосвязанных средств, методов и персонала, участвующих в обработке данных. (средства: аппаратные и программные, метод: моделирование, персонал: человек).

Виды ИС:

1) Разомкнутые (системы, в которых полученная потребителем информация используется произвольно, а после получения информация от потребителя в систему ничего не поступает) – справочная, библиотечная система и т.д.

2) Замкнутые (системы, в которых осуществляется тесная связь между пользователем и ИС, осуществляющаяся с помощью введения в структуру ИС канала обратной связи) – продажа авиабилетов и т.д.

Процессы, происходящие в ИС:

1) Ввод информации из внешних и внутренних источников;

2) Обработка и представление информации в удобном виде;

3) Хранение и вывод информации;

4) Ввод информации от потребителя через канал обратной связи (для замкнутых).

Значение ИС:

1) Освобождение от рутинной работы ща счёт автоматизации;

2) Обеспечение достоверности информации;

3) Обеспечение более рациональной обработки связи.

Структура ИС:

1)  Подсистема технического обеспечения: ПК, центр сбора, хранения информации и линии связи;

2)  Подсистема программного обеспечения;

3)  Подсистема информационного обеспечения (совокупность всё информации, средства и методы её классификации);

4)  Подсистема математического обеспечения: математические модули, алгоритмы;

5)  Подсистема правового обеспечения: правовые нормы по использованию ИТ;

6)  Подсистема организационного обеспечения: документы, отражающие обращения пользователя с информационной системой.


Вопрос 5.

ЭВМ (электронно-вычислительная машина) – электронное устройство или система, способная выполнять задания чётко определённой последовательности действий.

Технологические достижения, способствовавшие появлению ЭВМ:

1) Изобретение электронных переключателей в виде электронных плат;

2) Разработка универсального метода кодирования информации в виде двоичной системы исчисления;

3) Создание модулей искусственной памяти.

В 1946 году в США создана первая ЭВМ – ЭНИАК (электро-цифровой интегратор и калькулятор): вес 30 тонн, площадь 200 м2 18000 ламп.

В 1949 в Англии создана первая ЭВМ с искусственной памятью – ЭДСАК.

В СССР первая ЭВМ в 1951 году – БЭСМ.

Технический прогресс позволили значительно изменить ЭВМ:

1) Сильное уменьшение размера;

2) Снижение стоимости;

3) Упрощение процедуры пользования;

4) Увеличение быстродействия в миллионы раз и значительное увеличение объёма памяти;

5) Усовершенствование электронных деталей.

ПК – ЭВМ универсального назначения на одного пользователя.

В 1976 году в США создан первый ПК – Apple

В 1984 году фирма Apple создала компьютер Macintosch (оба использовались для работы с графикой)

В 1981 году IBM создаёт IBM PC (для работы в офисах и телекоммуникаций).

Развитие ПК (усовершенствование):

1) 40-60-е годы – компьютеры первого поколения (ламповые);

2) 60-е – 65-е года – компьютеры второго поколения (полупроводниковые (транзисторные), за счёт чего размеры сильно уменьшились);

3) 65-е – 75-е года – компьютеры третьего поколения (интегральные микросхемы (транзисторы объединятся в микросхемы), что радикально снизило габариты);

4) 75-е – 85-е года компьютеры четвёртого поколения (создаются на базе микропроцессоров и становятся доступны рядовым пользователям);

5) С 85-х годов – компьютеры пятого поколения (на сверхбольших интегральных схемах с миллионами транзисторов).

Двоичная система хранения данных:

1)  Вся информация в памяти ПК хранится в двоичном коде, так как информацию в таком виде легко технически смоделировать (в виде электронных сигналов: ток идёт – 1, нет – 0):

а)    На магнитном диске, если направление магнитного поля одно – 1, другое – 0;

б)    На оптическом диске, если определённый участок поверхности диска отражает лазерный луч – 0, нет -1;

2)  Байт – минимальная адресная единица хранения дынных (в 1 байте 255 – максимальное число хранения);
Кодировка – способ компьютерного представления символов. ASCII – первая кодовая таблица (в США), по которой один символ занимает один байт: 0-127 – американская раскладка, 127-255 – дополнительные раскладки.
Кодовая таблица Unicod – 1символ – 2 байта, что позволяет закодировать более 65000 символов, вес файла удваивается.

3)  Для хранения текстов на ПК каждому символу следует поставить в соответствие целое число.

4)  Графическое изображение состоит из мельчайших точек, называемых растрами, которые образуют узор. Каждый растр можно отцифровать с помощью координат и цвета.

5)  Метод кодирования звука основан на том, что каждый сложный звук можно разложить на последовательность гармоничных сигналов, каждый из которых представляет собой правильную синусоиду и может быть описан числовыми параметрами.


Вопрос 6.

PC = Hardware (аппаратные) +Software (программные).

Аппаратное средство – устройства и приборы, входящие в состав ПК.

Программное средство – совокупность программ, управляющих аппаратными средствами и выполняющих задачи по обработке данных.

С точки зрения структуры ПК в аппаратных средствах выделяют конструктивные блоки:

1)  Системный блок:

а)    Электронные схемы, управляющие работой ПК, которые состоят из электронных плат. На основной материнской плате располагаются микропроцессор и внутренняя память.

б)    К материнской плате подключаются дочерние платы (видеоплата, аудиоплата, сетевая карта), обмен данными между всеми устройствами происходит с помощью шины.

в)    Блок питания, преобразовывающий электричество сети в ток низкого напряжения;

г) Вентилятор, системы охлаждения;

д)    Дисководы, накопители.

2)  Монитор;

3)  Клавиатура;

4)  Мышь.

Все устройства, подключаемые к ПК внешне, называются периферийными.

С точки зрения выполняемых функций выделяют функциональные узлы:

 


Устройства ввода (преобразуют различные виды информации в цифровую форму):

1)  Устройства ввода данных от человека:

а)    Клавиатура (104 символа), максимальная скорость набора 10-12 символов в секунду:

- Беспроводные (инфракрасные лучи, радиоволны);

- Виртуальные (физически не существующие):

a.   экранная (проектируется на поверхность с помощью инфракрасных лучей);

b.   воображаемая (наделяется возможностью понимать текст);

б)    Координатные манипуляторы – позволяют на расстоянии управлять графическими объектами:

- 1964 – изобретение мыши, первые мыши были механическими, затем оптомеханическими, сейчас – оптические, основанные на использовании миниатюрной фотокамеры:

a.   Беспроводные (лазерные, инфракрасные, радиоволны);

b.   Виртуальные;

- Трекбол (перевёрнутая мышь)>> трекпоинт (миниматюрный джойстик размером 5-8мм на клавиатуре)>> тачпад (чувствительная контактная площадка, движение пальца по которой перемещает курсор).

- Джойстик – рычажной манипулятор для ввода информации о движении руки (как правило для игр);

- Сенсорный экран – координатное устройство, позволяющее путём прикосновения в области экрана монитора производить выбор необходимого элемента данных или вводить данные.

в)    Сканер – устройство для оптического ввода изображения в память ПК. При введении текста он воспринимается как картинка. Для преобразования в символьный формат используются программы оптического распознавания символов (Fine Reader):

- Ручные;

- Роликовые (похожи на факс: лист движется мимо неподвижного света);

- Планшетные (лист фиксируется, движется луч света);

- Барабанные (в полиграфии);

- Трёхмерные;

- Сканеры штрих-кода;

г) Дигитайзер (диджитайзер) – кодирующее устройство, позволяющее поточечно вводить в ПК сложную графику, используется для ввода чертежей, схем большого формата.

д)    Микрофон – устройство для ввода звуковой информации, подключаемое к звуковой карте, которая преобразует звук в цифровую форму.

е)    Веб-камера – устройство для ввода в память ПК видеоинформации в режиме реального времени.

ж)   Для альтернативного способа управления ПК используются:

- Речевой интерфейс (управление ПК голосом);

- Мыслительный интерфейс (с помощью специальных датчиков);

- Управление жестами.

2)  Устройства ввода данных с других ПК: сетевая плата, модем;

3)  Устройства ввода данных из устройств хранения: дисководы, накопители, USB-порты.

Вопрос 7.

PC = Hardware (аппаратные) +Software (программные).

Аппаратное средство – устройства и приборы, входящие в состав ПК.

Программное средство – совокупность программ, управляющих аппаратными средствами и выполняющих задачи по обработке данных.

С точки зрения структуры ПК в аппаратных средствах выделяют конструктивные блоки:

5)  Системный блок:

а)    Электронные схемы, управляющие работой ПК, которые состоят из электронных плат. На основной материнской плате располагаются микропроцессор и внутренняя память.

б)    К материнской плате подключаются дочерние платы (видеоплата, аудиоплата, сетевая карта), обмен данными между всеми устройствами происходит с помощью шины.

в)    Блок питания, преобразовывающий электричество сети в ток низкого напряжения;

г) Вентилятор, системы охлаждения;

д)    Дисководы, накопители.

6)  Монитор;

7)  Клавиатура;

8)  Мышь.

Все устройства, подключаемые к ПК внешне, называются периферийными.

С точки зрения выполняемых функций выделяют функциональные узлы:

 


Устройства вывода (преобразуют информацию из цифровой формы в привычные для пользователя виды:

1)  Устройства вывода пользователя:

а)    Монитор (вместе с видеокартой составляет видеоподсистему. Вся информация формируется на видеокарте, а затем переносится на экран).

- Основные характеристики:

a.   Разрешением (количество точек, выведенных по горизонтали и вертикали в графическом режиме);

b.   Цветопередача (палитра) : SWGA – 16,7 млн цветов, AKCGA – 24 млн цветов;

c.   Частота развёртки (частота обновления);

d.   Размер по диагонали (дюйм – 2,54 см);

e.   Видеокарта имеет внутреннюю память;

- Типы мониторов:

a.   С электронно-лучевой трубкой;

b.   ЖК –мониторы ( малые габариты, экологически чистые);

c.   Плазменные (изображение не искажается в хорошо освещённом помещении);

d.   Полимерные (OLED, LED);

e.   Проекционные (видеопроектор или экран размещаются отдельно или в одном корпусе);

f.    Лазерные (на основе лазерной панели: очень энергоэкономные, с высоким качеством изображения, вечным сроком службы, в комплекте с затворными стереоочками способны выводить 3D-изображения);

g.   Виртуальные (технология устройств вывода, формирующая изображение на сетчатке глаза);

h. Гелеодисплей (позволяет формировать цветное трёхмерное изображение – голограмму).

б)    Принтер (периферийное устройство ПК для перевода текста или графики на физический носитель из электронного вида). По способу печати делятся на:

- Матричные (печатная головка состоит из иголок (матриц), и через красящую ленту отпечатываются символы; печать только текстов, низкое качество, очень дешёвая печать, печать до 8 экземпляров с копиркой);

- Струйные (катриджы имеют 4 типа чернил: синий, жёлтый, красный, чёрный; печатающие головки имеют маленькие отверстия – сопла, через которые под давлением выдуваются частички чернил, смешивающиеся и образующие палитру цветов; скорость печати 10-20 страниц в минуту (текст), чернила высыхают);

- Лазерные (высокое качество печати, скорость -40 страниц в минуту (текст); частички порошка (тонера) под воздействием лазера (нагрева) вплавляются в лист бумаги);

- Сублимационные (используются в полиграфии, позволяют получить фотографическое качество печати; порошок, минуя жидкое состояние, становится газообразным и напыляется на бумагу);

- Существуют многофункциональные устройства – блок, выполняющий функции принтера, сканера, ксерокса и факса (All in One – AIO);

в)    Плоттер (графопостроитель) – устройство, выполняющее функции вывода графики, чертежей, схем на бумагу большого формата (А0, А1);

г) Аудиосистема;

2)  Устройства вывода на другой ПК:

а)    Модем (мо|дем – модулятор и демодулятор) – устройство для преобразования цифровой информации в электронные сигналы и наоборот, бывают внутренними и внешними;

б)    Сетевой адаптер – устройство, обеспечивающее подключение компьютера к локальной сети:

- Сетевая карта – соединяет ПК через проводные линии связи;

- Блютуз – позволяет установить соединение между ПК и мобильным телефоном;

- Wi-Fi – адаптер – позволяет соединить ноутбук с подспотом, а затем с интернетом;

Вопрос 8.

PC = Hardware (аппаратные) +Software (программные).

Аппаратное средство – устройства и приборы, входящие в состав ПК.

Программное средство – совокупность программ, управляющих аппаратными средствами и выполняющих задачи по обработке данных.

С точки зрения структуры ПК в аппаратных средствах выделяют конструктивные блоки:

9)  Системный блок:

а)    Электронные схемы, управляющие работой ПК, которые состоят из электронных плат. На основной материнской плате располагаются микропроцессор и внутренняя память.

б)    К материнской плате подключаются дочерние платы (видеоплата, аудиоплата, сетевая карта), обмен данными между всеми устройствами происходит с помощью шины.

в)    Блок питания, преобразовывающий электричество сети в ток низкого напряжения;

г) Вентилятор, системы охлаждения;

д)    Дисководы, накопители.

10)   Монитор;

11)   Клавиатура;

12)   Мышь.

Все устройства, подключаемые к ПК внешне, называются периферийными.

С точки зрения выполняемых функций выделяют функциональные узлы:

 


Устройства хранения:

1)  Внутренняя память (представлена в виде электронных схем, расположенных на материнской плате, отличается небольшим временем доступа и малым объёмом):

а)    ОЗУ (RAM) – оперативно запоминающее устройство: кратковременная, быстродействующая память, предназначенная для хранения исполняемых в данный момент программ и необходимых для этого данных. После выключения её содержимое пропадает. У первых ПК размер 16 Кб, сегодня 1-2 Гб.

б)    ПЗУ (ROM) – постоянно запоминающее устройство: в неё при сборке на заводе записывается специальный комплекс программ BIOS, который позволяет осуществлять тестирование всех устройств и начальную загрузку ОС при включении ПК, является энергонезависимой.

в)    Перспективные технологии памяти: разработчики фирм Intel и MS заявили, что BIOS является препятствием для внедрения новых технологий, поэтому сейчас ведётся работа над созданием принципиально новой энергонезависимой памяти с высоким быстродействием, которая позволит не загружать ПК в начале каждого сеанса, т.е. он будет всегда в готовности.

2)  Внешняя память (представлена накопителями информации, имеет большой объём и более длительное время доступа, чем внутренняя память):

а)    Винчестер (первый был создан в середине 50-х годов):

- Объём (200-300 Гб);

- Скорость вращения магнитных пластин (максимально 150000 оборотов в минуту);

- Время доступа (6-10 миллисекунд)

- Плотность записи данных на дюйм;

- Существуют съёмные жёсткие диски, которые устанавливаются отдельно;

б)    Твёрдотелый накопитель (SSD – Solid State Drive): запоминающее устройство с функциями жёсткого диска, но без движущихся механических частей, накопителем информации являются микросхемы памяти, используется в компактных устройствах);

в)    Съёмные носители информации:

- Дискета (размер 3,5 дюйма по диагонали, объём 1, 4 Мб);

- Стриммеры (кассеты, внутри которых находится магнитная лента шириной 4-8 мм, ёмкость – 200 Гб, служат для хранения архивов или создания большой резервной копии информации);

- Флеш-память (в виде карточной периферии разных форматов, которые используются в карманных ПК, мобильных телефонах, цифровых фотоаппаратах, объём 4-6 Гб);

- Оптические носители (информация считывается и записывается с помощью лазера):

- CD (первые в 1979 году, диаметр 120 мм, запись только с одной стороны, объём 650 Мб)

a.   CD-ROM (Read Only Memory) – возможность многократной перезаписи данных;

b.   CD-R (Record able) – однократная запись;

c.   CD-RW (Re Writable) ) – возможность многократной перезаписи данных;

- DVD (Digital Versatible Disk) (первые в 1996 году, информация может быть записана с двух сторон). Бывают:

a.   DVD-ROM

b.   DVD-R

c.   DVD-RW

- По технологии записи различают:

a.   Односторонние однослойные (объём 4,7 Гб);

b.   Односторонние двуслойные (8,5 Гб);

c.   Двусторонние однослойные (9,4 Гб);

d.   Двусторонние двуслойные (17 Гб);

- Новые технологии:

a.   Blu-Ray disk – ультрафиолетовый накопитель, в котором повышение плотности происходит за счёт уменьшения длины волны лазера, сегодня объём 25-50 Гб;

b.   Трёхслойные диски, в 2006 году позволяли записывать до 300 Гб;

c.   Голографические носители: объёмная запись по всей толщине записываемого слоя, объём 1 Терабайт.

Вопрос 9.

PC = Hardware (аппаратные) +Software (программные).

Аппаратное средство – устройства и приборы, входящие в состав ПК.

Программное средство – совокупность программ, управляющих аппаратными средствами и выполняющих задачи по обработке данных.

С точки зрения структуры ПК в аппаратных средствах выделяют конструктивные блоки:

13)   Системный блок:

а)    Электронные схемы, управляющие работой ПК, которые состоят из электронных плат. На основной материнской плате располагаются микропроцессор и внутренняя память.

б)    К материнской плате подключаются дочерние платы (видеоплата, аудиоплата, сетевая карта), обмен данными между всеми устройствами происходит с помощью шины.

в)    Блок питания, преобразовывающий электричество сети в ток низкого напряжения;

г) Вентилятор, системы охлаждения;

д)    Дисководы, накопители.

14)   Монитор;

15)   Клавиатура;

16)   Мышь.

Все устройства, подключаемые к ПК внешне, называются периферийными.

С точки зрения выполняемых функций выделяют функциональные узлы:

 


Устройства обработки (микропроцессор) – осуществляет обработку всей информации и управляет работой остальных устройств, состоит из

1)  АЛУ (арифметическое и логическое устройство) – ядро микропроцессора;

2)  Сопроцессор (устройство, ускоряющее работу процессора при выполнении математических вычислений);

3)  КЭШ-память (высокоскоростная память, используемая процессором для временного хранения информации):

а)    1 уровня – небольшая, сверхбыстрая, нужная для хранения наиболее часто используемых команд и данных;

б)    2 уровня – более 24 Мб, так как обработка данных микропроцессором происходит быстрее, чем обмен данными между микропроцессором и ОЗУ; чтобы не простаивать, микропроцессор выбирает из ОЗУ новую порцию информации и заносит её в эту память;

4)  УУ (устройство управления) – выполняет управление прочими компонентами.

5)  Основные характеристики микропроцессора:

а)    Тактовая частота (количество импульсов (тактов), вырабатываемых тактовым генератором процессора за 1с (2-5 ГГц);

б)    Разрядность (количество бит информации, обрабатываемых за один такт (32-64 бита);

в)    Тип микропроцессора (количество ядер (2-4));

г) Быстродействие (количество операций в секунду);

Первый был создан фирмой Intel в 1971 году, тогда же был сформулирован закон Гордона Мура: «Число транзисторов на кристалле кремния будет удваиваться каждые 1,5 года», данный закон будет действовать до 2020 года.

Мощность ПК может увеличиваться:

д)    За счёт изменения технологии (2,4 ядра, что позволяет параллельно обрабатывать данные);

е)    За счёт увеличения числа транзисторов;

Технологии на замену кремния:

ж)   Молекулярные транзисторы;

з)    ПК на базе молекул ДНК;

и)   Квантовые ПК.


Вопрос 10.

Классификация ПК (в последнее время грань между этими классификациями в значительной степени исчезла):

1)  Бытовые ПК;

2)  Профессиональные.

Признаки классификации:

1)  По уровню специализации:

а)    Универсальные (ПК, решающие широкий круг задач и могущие быть различной конфигурации);

б)    Специализированные (предназначены для решения конкретных задач: бортовые ПК, ПК, интегрированные в технику, промышленные ПК, могущие работать в сложной среде):

- Графические станции (ПК для работы с графикой, используемый для подготовки кино, видеофильмов, в издательских отделах и т.д.);

- Файловые серверы (ПК, обеспечивающие доступ к файлам для удалённых пользователей, имеющие большой объём внешней памяти);

- Сетевые серверы (ПК для передачи информации в интернете).

2)  По размерам:

а)    Настольные (широко распространены, отличаются простотой изменения конфигурации);

б)    Портативные (ноутбуки, нетбуки) – имеют все функциональные узлы, что и ПК, могут работать до 8 часов без подключения к источнику питания, имеют выход в интернет);

в)    Карманные:

- КПК (PDA) – вес до 200 граммов, вместо жёсткого диска используется флеш-память, ПО записывается в ПЗУ:

a.   Смартфон («умный» телефон) – мобильный телефон, работающий на своей ОС, использующийся для доступа в интернет, почты, просмотра видео, прослушки музыки, могущий работать с Word, Excel, программами для чтения книг;

b.   Айфон – мультимедийный смартфон;

- Коммуникатор – карманный ПК со встроенным JSM-модулем, позволяет работать с таблицами, текстом, имеет богатый мультимедийный инструментарий, функции навигатора, справочных систем;

3)  По совместимости (множество видов и типов ПК, выпускаемых разными фирмами и работающих с разным ПО):

а)    Аппаратная совместимость (две платформы):

- IBM PC (WinTel – Windows Intel) – для обработки текстов, работы с большими базами данных, изначально были предназначены для телекоммуникации;

- Macintosch (Apple) – используются в настольно-издательских системах, для создания мультимедийных приложений.

б)    На уровне ОС;

в)    Программная совместимость;

г) Совместимость на уровне данных.

Суперкомпьютеры – мощные многопроцессорные компьютеры, вес 40-100 тонн, площадь 150 м2, 1-100 трлн. операций  секунду, выпускаются в единичных экземплярах, используется для решения сложных задач, которые нельзя решить на ПК:

1)  В сейсмологии;

2)  В метеорологии;

3)  Для моделирования сложных явлений и процессов.


Вопрос 11.

ПО –совокупность программ, записанных на машинном языке (Soft).

·    Системные (25%)

·    Прикладные (пользовательские) средства

·    Прикладные инструментальные средства (языки программирования).

Системное (25%) – ПО, использующееся для работы и обслуживания ПК:

ОС, Утилиты, Драйвера,Программные оболочки.

ОС – основная управляющая программа для координации внутренних функций ПК и для контроля выполнения операций ПК.

Функции:

1)  Управление работой ПК и его ресурсами;

2)  Запуск прикладных программ на выполнение;

3)  Предоставление пользователю удобного интерфейса;

Классификация ОС:

1)  По интерфейсу:

а)    Текстовые (простые ОС) – рассчитаны на одного пользователя, однозадачны, 16-разрядные, несетевые, последняя MS DOS7 (до середины 90-х); затем появились программы оболочки (Norton Commander), где управление велось с помощью функциональных клавиш, также графические операционные оболочки (Win 3.11);

б)    Графические – имеют графический интерфейс, который характеризуется наличием окон, пиктограмм, меню, полос прокрутки, управлением с помощью мыши; многозадачны, многопользовательские, 32-64-разрядные, сетевые (первая платформа – MS Windows 95/98/NT/2000/ML/XP/Vista/7/8; вторая платформа – System, Mac OS, универсальны - Unix, Linux).

в)    Предполагается, что в будущем будут разрабатываться ОС, должные упростить работу с ПО, должные поддерживать интерактивный ввод/вывод данных, то есть двусторонний разговор на естественном языке (социальный интерфейс);

2)  По режиму работы:

а)    Автономные ОС, устанавливающиеся на отдельном компьютере (MS Windows 2000/XP/Vista/7);

б)    Сетевые:

- «клиент-клиент», где все ПК равны и используются при создании локальных сетей;

- «клиент-сервер» - архитектура корпоративных и глобальных сетей ( Windows 2000/Server; XP/Server; Vista/Server).

- Функции сетевой ОС:

a.   Связь всех ПК в сеть;

b.   Координация всех функций ПК;

c.   Обеспечение защищённого доступа к данным и периферийным устройствам.

Утилиты (вспомогательные или служебные программы, которые предоставляют ряд дополнительных услуг и помогают пользователю эффективнее работать с системой):

1)  Внутренние (встроенные):

а)    Утилита установки и удаления программ и оборудования;

б)    Утилита динамического сжатия данных на диске;

в)    Утилита резервного копирования данных;

г) Сканирование диска на логические ошибки;

д)    Утилита дефрагментации диска и т.д. (оптимизировать работу жесткого диска)

2)  Внешние (устанавливаются как отдельные программы):

а)    Архиваторы WinRar и WinZip:

б)    Пакет утилит Total Commander;

Антивирусные программы (программы для предотвращения заражения компьютерной сети вирусами и ликвидации последствий).

Вирус – программа, которая может создавать свои копии (необязательно похожие на оригинал) и внедрять их в файлы, изменять состояние дисков, наносить вред иного рода. Впервые были созданы в середине 80-х.

1)  В зависимости от типа поражаемых файлов вирусы делятся:

а)    Поражающие загрузочные сектора;

б)    Поражающие исполнимые файлы (.exe, .com, .bat);

в)    Макровирусы (файлы документов)

2)  По принципу распространения делятся:

а)    «черви» - очень быстро распространяются, о не очень опасны);

б)    «троянские кони» - не распространяются, являются механизмом вторжения и поражения.

Драйвера – программы для управления устройствами ПК, чаще всего ввода/вывода.


Вопрос 12.

Прикладные (пользовательские) программы – программы, превращающие ПК в инструмент для выполнения какого-либо конкретного вида работ, нужного пользователю.

1)  Деловое ПО:

а)    Офисное:

- Системы автоматизации делопроизводства (MS Word, Excel); обработка текстов

- Программы создания графики (PhotoShop, CoralDraw, PowerPoint);

- Системы управления документооборотами( СУБД, электронные архивы);

- Телекоммуникационные программы (браузеры, электронная почта).

- Основные направления развития офисного ПО:

a.   Создание сетевых версий офисного ПО;

b.   Дальнейшее развитие технологий по распознаванию речи;

c.   Разработка технологий интеллектуальной обработки текста (создание и внедрение в обычные программы ИИ, могущего создавать самостоятельно документы, приглашения, текстовые сообщения);

б)    Лингвистическое ПО – программы, связанные с обработкой текстовой информации, с пониманием и порождение текста и речи:

- Программы автоматического чтения текста (Fine Reader);

- Программы рукописного ввод текста; распознавание

- Системы автоматического аннотирования и реферирования текста;

- Электронные словари;

- Системы автоматического перевода текста;

- Интеллектуальные поисковые системы;

- Системы порождения и понимания текста;

- Системы распознавания и синтеза речи;

- Различные экспертные системы;

- Автоматически обучающие системы.

в)    Экономическое ПО – программы в экономике и финансовой сфере. Из всего ПО в СНГ более половины составляет экономическое. Наиболее популярны бухгалтерское, финансово-аналитическое, управленческое, информационно-правовое.

2)  Домашнее ПО:

а)    Программы для развития и ведения домашнего хозяйства;

б)    Для бизнеса (работа по контракту и поиск в интернете);

в)    Для самообразования (словари, энциклопедии, образовательные программы);

г) Развлечения.

Прикладные инструментальные средства – совокупность программ позволяющих программистам разрабатывать ПО: языки программирования и системы проектирования приложений:

1)  Язык программирования (алгоритмический язык) – искусственный язык для представления алгоритма решения задачи в виде, понятном компьютеру (существует около 2000 языков).

2)  Системы проектирования – интегрированный комплекс из:

а)    Некоторого языка программирования;

б)    Программы-компилятора, преобразующей текст программы в машинные коды;

в)    Программы-компановщика, объединяющей отдельные модули;

г) Программы-отладчика, выявляющей ошибки;

д)    Большой библиотеки готовых к выполнению программ.

3)  Классификация языков программирования:

а)    Языки ассемблера – записанное в алгоритме действие в виде машинных кодов;

б)    Языки системного уровня, где действие алгоритма записано в виде отдельных английских слов или их частей (Pascal, C++);

в)    Языки описания сценариев (для связывания готовых программ в новые, более сложные программы (скриптовые)): Java Script, Delphi.

Вопрос 13.

Компьютерная сеть – совокупность компонентов, которые могут осуществить информационное взаимодействие друг с другом с помощью коммуникационного оборудования и ПО через линии связи.

Компоненты компьютерной сети:

1)  Определённое число ПК и периферийных устройств;

2)  Средства электронной связи – совокупность устройств, осуществляющих передачу на расстоянии:

а)    Линии связи:

- Проводные:

a.   Кабель;

b.   Телефонные линии связи;

c.   Оптоволоконные линии связи (кабель из стекловолокна);

d.   Кабельное ТВ;

e.   Силовая электронная линия;

- Беспроводные:

a.   Инфракрасное излучение (в прямой видимости);

b.   Лазерное излучение;

c.   Радиосвязь (Wi-Fi, Wi-max);

d.   Спутниковый канал связи;

б)    Устройства для подключения к линиям связи:

- Сетевая карта (устройство для физического подключения ПК к локальной сети);

- Модем (устройство для подключения ПК к глобальной сети);

3)  Коммуникативное оборудование:

а)    Концентраторы, коммутаторы, мосты, шлюзы, маршрутизаторы – устройства, позволяющие объединить сегменты локальных сетей, несколько локальных сетей, локальные и корпоративные сети с интернетом;

4)  ПО:

а)    Сетевой протокол (набор правил при передаче данных по сети);

б)    Сетевые приложения (строятся по технологии «клиент ->сервер»)

в)    Сетевая ОС

Сервер – ПО, установленное на ПК сервера и отвечающее на запросы клиентского ПК.

Классификация компьютерных сетей:

1)  Локальные (LAN) – сети, объединяющие ПК одного пользователя, здания, предприятия, ограниченные небольшой территорией.

а)    Значение локальной сети:

- Совместное использование данных, прикладных программ;

- Обмен информацией;

- Выход в интернет.

2)  Региональные (MAN) – сеть, предназначенная для обслуживания региона (города, области), нужная для связи локальных сетей с глобальной.

а)    Корпоративная сеть – сеть, объединяющая ПК в рамках крупной корпорации, офисы которой находятся в разных городах. Является закрытой.

Назначение корпоративной сети:

a.   Объединение распределённых офисов компании

b.   Обеспечение безопасности информации;

c.   Разделение дорогостоящих ресурсов и разделение доступа к ним;

d.   Выход в интернет.

3)  Глобальная (WAN) – сообщество из разноплановых сетей, объединяющее миллиона ПК.

а)    Особенности:

- Децентрализованная обработка информации; независимо от других

- Передача информации на большие расстояния;

б)    Линии связи: радио, спутниковая, телефонная, оптоволоконная, силовая.

в)    Коммуникационное оборудование – маршрутизатор. ПК, который направляет пакеты данных.

г) Назначение: обеспечение каждому доступа к информации, циркулирующей в сети и предоставление возможности общаться друг с другом.

д)    Использование:

- Для учёбы, развлечения, общения и т.д.;

- Услуги удалённого доступа;

- Передача файлов и сообщений.

е)    История создания:

- 1964-1969 – создание первой глобальной сети Arpanet;

- 1984 – разделение данной сети на две: NSFnet прародитель интернета), MILnet;

- 1988 – сеть Интернет стала международной.

ж)   Основные понятия: представляет собой объединение крупных узлов (хост-компьютеров), каждый из которых является мощным постоянно включённым ПК. Каждым узлом управляет организация – провайдер.

з)    Для обмена информацией используются протоколы двух типов:

- Базовые (отвечают за физическую пересылку информации) – основным является протокол TCP-IP:

a.   TCP (Transfer Controll Protocol) – разбивает информацию на пакеты и описывает, каким образом будет устанавливаться надёжный канал связи;

b.   IP (Internet Protocol) – добавляет к каждой порции служебную информацию с адресом отправителя и получателя и обеспечивает их доставку;

- Прикладные (отвечают за функционирование специальных служб на программном уровне);

и)   Каждый узел имеет свой уникальный адрес – цепочку цифр или соответствующее имени этой цепочки символьное имя ПК;

- Цифровой адрес (IP-адрес) – двоичное число в виде 4 десятичных чисел, разделённых точкой. Для удобства пользователя используют доменный адрес – представление в виде нескольких цепочек символов (доменов), разделённый точкой. Среди доменов существует иерархия: домен в конце адреса называется доменом самого высокого уровня, он идентифицирует географический регион или тип организации.


Вопрос 14.

Интерне́т— всемирная система объединённых компьютерных сетей.

Основные ресурсы сети Интернет:

-   Средства поиска информации и размещения личной информации:

a.   WWW (World Wide Web) – совокупность взаимосвязанных гипертекстовых документов, один из самых современных средств в интернете, информация в нём представлена в виде Web-страниц.

· Web-страница – документ, имеющий графический интерфейс, содержимое которого описано с помощью языка HTML.

· Web-сайт – совокупность взаимосвязанных Web-страниц на одном сервере, информация представлена в виде гипертекста, то есть нелинейного текста из разнородной информации. Переходы между Web-страницами осуществляются с помощью гиперссылок. Используется технология «клиент-сервер».

· Web-сервер – сервер-программа, установленная на ПК-сервере, позволяющем хранить и пересылать Web-страницы.

· Web-браузер – программа-клиент для навигации и просмотра Web-страниц. Прикладной протокол WWW – HTTP.

b.   К услугам WWW относятся:

· Тематические каталоги ресурсов;

· Поисковые машины, или автоматические роботы;

· Системы поиска людей и организаций;

· Активные информационные каналы (Web-вещание);

· Интерактивные сервисы; соц. Сети.

· Создание почтовых ящиков и Web-страниц.

c.   FTP (File Transfer Protocol) – хранилище и система пересылки всевозможных файлов архивов.

d.   Telnet – сервис для удалённого управления компьютером, позволяющий обеспечить работу так, как будто терминал пользователя является терминалом сервера.

-   Средства обмена информацией:

a.   Электронная почта (e-mail) – средство обмена информацией, подготовленной в электронном виде, между людьми, имеющих доступ в интернет

b.   Списки рассылки – услуга, которая позволяет определённому числу пользователей поставлять периодические издания, рекламную информацию;

c.   Usenet – глобальная распределительная система дискуссий, включающая множество групп новостей, хранящихся на серверах по всему миру;

d.   IRC (chat) – обмен текстовыми сообщениями в реальном времени;

e.   Интернет-пейджинг – система, позволяющая зарегистрироваться в своей системе серверов и получить пейджинговый номер (ICQ). При подключении к интернету программа определяет текущий IР-адрес ПК и отправляет его на центральный сервер, что даёт Вам возможность вызвать любого человека, имеющего пейджинговый номер и подключённого к интернету.

f.    Аудиоконференции;

g.   Видеоконференции;

h. Радио, телевещание через интернет;

i.    Интернет-телефония – возможность передачи сообщений с ПК на ПК, с ПК на телефон, с телефона на телефон.


Вопрос 15.

Возможности современного ПК

Известно, что компьютер был изобретен как средство вычисления, однако постепенно к его возможностям добавлялись и другие функции. Сегодня уже невозможно сходу перечислить все сферы применения компьютера. Наиболее остроумным определением назначения компьютера является следующее: ”Компьютер есть средство решения тех задач, которые человек в состоянии ему поручить на данном уровне развития техники”.

Проследим, как расширялась область применения ПК по мере развития его графических, коммуникационных и интеллектуальных возможностей.

Компьютерная графика сыграла важнейшую роль в развитии вычислительной техники, определив десятки направлений использования современного компьютера. Благодаря 3D-графике археологи смогли воссоздать древнейшие умершие города; палеонтологи – увидеть умерших животных; криминалисты – создать фотороботы людей, находящихся в розыске, идентифицировать угнанные автомобили.

Мощные графические серверы позволяют ученым исследовать и оценивать в виртуальной 3-мерной графической среде сейсмические данные и модели нефтяных месторождений. Компьютерная графика революционизировала процесс создания мультипликаций, позволила создавать в кино виртуальные декорации любой сложности.

Приложения виртуальной реальности нашли применение в индустрии развлечения. Архитекторы получили в свои руки инструмент градостроительного планирования, медики – инструмент диагностики заболеваний человека.

В области лингвистики ПК  позволяют автоматически создавать аннотации и рефераты текстов, проверять орфографию и морфологию, выполнять перевод не только текстов, но и речевых сообщений с одного языка на другой; синтезировать научно-технические тексты, распознавать и синтезировать человеческую речь ( е в полном объеме).

Внедрение сетей позволило превратить компьютер из вычислительного в коммуникационное устройство. С появлением INTERNET пошел следующий век в эволюции человечества – век «информационных технологий», век развития компьютеров и компьютерных сетей, время, когда вовремя доставленная информация стала цениться как никогда раньше. В настоящее время ЭВМ задействована практически во всех отраслях производства, науки и обороне стран. Человек стремится максимально облегчить себе работу во всем, хочет, чтобы ЭВМ делало за него практически всю работу, а для этого пытается разработать более совершенные машины. ЭВМ нового поколения – это машины недалекого будущего. Основным их качеством должен быть высокий интеллектуальный уровень. Это будут компьютеры с искусственным интеллектом. В них будет возможным ввод с голоса, голосовое общение, машинное «зрение», машинное «осязание». Многое уже практически сделано в этом направлении

Виртуальная реальность – компьютерная система, способная внушить пользователю иллюзию мира, порождённого компьютером и позволить ему управлять этим миром по своему желанию (синоним «киберпространство»). Для создания используется специальное ПО, позволяющее создавать объект, наделять его определёнными свойствами и программировать законы его поведения в виртуальной реальности.

Технологии создания виртуальной реальности:

1)  Системы типа «окно в мир» - реалистичный трёхмерный вывод изображения для созерцания;

2)  Виртуальная реальность второго лица, не требующая специальных аппаратных средств (тренажёры, игры);

3)  Система видеоналожения – с помощью камеры изображение накладывается на двухмерную картинку, используемую в телевидении;

4)  Системы полного погружения – создание и вывод изображения с углом обзора 180 градусов, трёхмерный звук, моделирование кинестетических эффектов – осязания, обоняния;

5)  Системы дистанционного присутствия – установка чувствительного датчика на объекте реального мира, который связан с пользователем и ПК.

Аппаратное обеспечение виртуальной реальности:

1)  ПК с хорошими техническими характеристиками;

2)  Сенсорные перчатки, использующиеся для осязания;

3)  Устройства для стереовидения: стереоочки, виртуальные шлемы.

Сферы применения виртуальной реальности:

1)  Бизнес: электронная торговля, туризм и путешествия, архитектура;

2)  Медицина;

3)  Образование;

4)  Военное дело;

5)  Развлечения;

6)  Домашнее хозяйство.

Тенденции в развитии интернета:

4)  Упрощение процедуры подключения к интернету;

5)  Появление новых средств доступа в интернет;

6)  Повышение скорости доступа к сети;

7)  Увеличение количества IP-адресов (введена седьмая версия протокола IP, которая поддерживает не 4, а 16-байтовое число, что позволить создать 1039 IP-адресов);

8)  Предоставление пользователю широких возможностей: интернет-телефонии, интерактивного вещания, электронной торговли;

9)  Создание сети Интернет2:

а)    Цель: создание высокоскоростной сети и приложений для неё;

б)    Проект по созданию сети нового поколения, призванной избавить от недостатков Интернет1;

в)    Пользователи Интернет2 имеют доступ в Интернет1, наоборот нет.

г) К концу столетия территория сети должна стать основной информационной средой, а интернет – основным средством связи.


Вопрос 16.

Суть метода решения задач заключается в создании модели некоторого объекта, явления или процесса.

Модель – формализованное описание объекта, процесса или явления, выраженное конечным набором предложений какого-либо языка, математическими формулами, таблицами, графиками, специальными значками или схемами. Упрощенное представление реального устройства иили протекающих  в нем процессовявлений.

Свойства модели:

1) Модель выступает в качестве упрощённого аналога изучаемого объекта;

2) Модель не должна быть сложнее своего оригинала;

3) Способ моделирования должен быть самым экономичным методом изучения объекта;

4) Построенная модель должна быть предельно простой и не содержать противоречий;

5) Модель должна иметь общий (универсальный) характер, позволяющий использовать её для изучения других, сходных объектов;

6) Модель должны отражать наиболее существенные черты реального мира.

Виды моделей:

1) Структурные (служат для изучения и описания внутреннего строения некоторого объекта);

2) Функциональные (позволяют изучать поведение объекта в процессах);

3) Динамические (позволяют объяснить процесс в динамическом развитии).

В лингвистике чаще всего используются функциональные модели.

Общий принцип решения лингвистической задачи методом моделирования:

1)  Постановка задачи:

а)    Описание решаемой задачи;

б)    Формулирование цели моделирования;

в)    Анализ оригинала модели объекта, т.е. выделение наиболее важных (формальных) свойств, которые мог бы легко опознать ПК.

2)  Разработка модели: построение модели в виде алгоритма.
Алгоритм – точное предписание по выполнению в определённом порядке некоторой последовательности действий (физических или умственных, приводящее к решению некоторой типовой задачи.
Свойства алгоритма:

а) Дискретность (алгоритма разбивается на конечное число шагов, причём только после выполнения предыдущего шага можно выполнить следующий);

б) Результативность (при всех начальных условиях число шагов алгоритма конечно и он приводит к решению задачи);

в) Массовость (по данному алгоритму может быть решён целый ряд типовых задач, которые отличаются лишь разными начальными условиями);

г)   Детерминированность (при многократном решении одной и той же задачи с одинаковыми начальными условиями получается всегда один и тот же результат);

д) Формализованность (выполняющий алгоритм может не вникать в смысл того, что он делает, т.к. всё равно придёт к верному результату);

Способы записи алгоритма:

а) Словесный;

б) Графическое представление (шаги изображаются геометрическими фигурами, образующими блок-схему);

в) Табличный;

г)   Словесно-графический (чаще всего используется при решении лингвистических задач);

3)  Проведение компьютерного эксперимента: связано с созданием на основе алгоритма компьютерной программы на каком-либо алгоритмическом языке (каждый шаг алгоритма будет записан в виде команды алгоритмического языка);

4)  Анализ результатов компьютерной модели: в процессе анализа результатов работы компьютерной модели выявляются логические ошибки в компьютерной программе и алгоритме.

Вопрос 17.

Системы автоматического чтения текстов

Для быстрого и качественного ввода текста в ПК используется сканер, работающий по принципу фотоаппарата. Чтобы «понять» текст, то бишь перевести графику в цифровой вид, нужна система автоматического распознавания текста.

OCR (Optical Charester Recognition) – компьютерная программа, позволяющая преобразовывать текст бумажного носителя в электронный текстовый файл.

Основные принципы работы системы:

1)  Целостность (объект описывается как целое с помощью значимых элементов и отношений между ними);

2)  Целенаправленность (распознавание строится как процесс выдвижения и целенаправленной проверки гипотез);

3)  Адаптивность (способность компьютерной системы к самообучению).

Этапы работы системы FineReader:

1)  Сканирование (получение графического образа документа;

2)  Распознавание текста страницы:

а)    Анализ графического макета страницы (выделение областей для распознавания, выделение в тексте строк и отдельных символов);

б)    Распознавание каждого символа на основе различных алгоритмов распознавания;

3)  Проверка орфографии;

4)  Сохранение.

Алгоритмы распознавания (классификаторы):

1)  Шаблонные (шрифтозависимые) – растровое изображение накладывается на шаблон, содержащийся в базе данных, наиболее подходящим является тот, у которого наименьшее количество точек отличается.

2)  Шрифтонезависимые:

а)    Признаковые (позволяют анализировать не всё изображение знака, а лишь некоторые признаки, вычисляется по формулам, не отвечает принципу целостности);

б)    Структурные (содержат информацию не о точечном изображении символа, а о правилах начертания (или структуры). Структурными элементами являются составляющие символ линии, однако данный метод чувствителен к дефектам изображения).

В FineReader работают все алгоритмы, экспертная система, встроенная внутрь ядра, сама выбирает нужный алгоритм.

Возможности OCR:

1)  Во время сканирования система автоматически подбирает яркость, фрагментирует каждую страницу, распознает символы текста;

2)  Позволяет распознавать печатные символы (»200 языков), рукопечатные и рукописные тексты.

3)  Способность самообучаться и распознавать плохо пропечатанные символы.

4)  Распознавание изображения, полученного с помощью цифрового фотоаппарата, а также файлы в формате PDF.

Развитие OCR идёт в направлении повышения точности распознавания текстов низкого качества, распознавание рукописного текста, выделение текстовой информации на фоне шумов, а также интеграций OCR-систем с различными программами обработки информации.


Вопрос 18.

Системы автоматического аннотирования и реферирования текста

Реферат – связный текст, кратко выражающий не только центральную тему документа, но и цель, методы, основные результаты описанного исследования или разработки.

Аннотация – краткое изложение содержания документа с общим представлением о его теме.

Машинный реферат – последовательность предложений исходного текста либо таблица, в ячейках которой ключевые слова или словосочетания (первый машинный реферат был сделан в 1958 году).

Этапы построения реферата человеком:

1. 1)Подготовительный (чтение текста и осмысление документа в целом);

2. Аналитический (референт выделяет основные смысловые единицы (предложения, слова, словосочетания), строит план реферата);

3. Этап непосредственного построения реферата (выделенные ранее единицы располагаются в единый вторичный текст в соответствии с планом).

В качестве смысловых единиц реферата могут быть:

1)  Полное (без изменений) ключевое предложение исходного текста;

2)  Перефразированное ключевое предложение;

3)  Предложение из ключевых слов и словосочетаний;

4)  Предложение, обобщающее несколько предложений исходного текста.

Смысловые единицы аннотации:

1)  Ключевые слова или словосочетания исходного текста с предшествующими им специальными словами – реляторами – заранее заготовленная фраза («тема состоит в том, что» и проч.);

2)  Специальные предложения исходного текста, содержащие элементы («рассматривается важная проблема» и проч.)

ПК должен уметь:

1)  Находить в тексте ключевые слова, словосочетания, предложения;

2)  Находить в тексте менее значимые единицы;

3)  Составлять из текстовых единиц смысловые единицы рефератааннотации.

Методы автоматического реферирования:

1. Статистический:

2. Позиционные: основным критерием этих методов является место или позиция предложения в тексте:

a. Метод заглавия (основное содержание текста выражается текстом заголовка) – составляет словарь ключевых слов на основе заголовковподзаголовков;

b. Метод локализации (работает на текстах узкой тематики) – идея в том, что в таких текстах предложения о цели и результатах занимают фиксированное место.

3. Логико-семантические: исследуют структуру и семантику текста.

a. Ключевое предложение – предложение с наибольшей функцией весомости влияют различные факторы:

b. Связь с левым и правым окружением;

c. Наличие в предложении семантически значимых слов;

d. Выделение текста шрифтом и т.д.

Каждый метод имеет достоинства и недостатки, используются комбинированно.

Данные методы относятся к направлению квазиреферирования, основаны на выделении из текстов наиболее информативных предложений, передающих основной смысл документа. Текст, полученный путём соединения отрывочных фрагментов, лишён гладкости.

Сегодня появились методы второго направления на выделение из текстов наиболее информативной информации и создания с помощью неё новых текстов. Такое реферирование приближается к интеллектуальному реферированию. Данные системы работают сразу с несколькими источниками, а также способны работать с видео.


Вопрос 19.

Методы автоматического реферирования:

1)  Статистический: в данном методе ключевое слово – это знаменательное слово текста, которое с учётом синонимов встретилось в тексте наибольшее число раз.

а)    Задача: по формуле где
F – число повторений слова в тексте,
m – число абзацев, где есть это слово,
N – количество слов в тексте,
n – количество абзацев в тексте
составить алгоритм, позволяющий получить:

- аннотацию текста в виде слов-реляторов со следующими за ними ключевыми словосочетаниями текста – ключевыми существительными со стоящими перед ними определениями, выраженными прилагательными или причастиями;

- словесный реферат текста в виде последовательной цепочки ключевых предложений – предложений, содержащих три и более ключевых слова.

- Словоупотребление – цепочка символов, заключённых между двумя пробелами.

- Словоформа – словоупотребление вне текста. Несколько словоформ, имеющих одно и то же лексическое значение, образуют слово.

б)    Алгоритм решения задачи:

- ПК по каждому абзацу составляет алфавитно-частотный словарь словоформ;

- Все словари объединяются в единый распределительный алфавитно-частотный словарь всего текста;

- Система «чистит» словарь, сжимая его до словаря потенциальных ключевых слов:

a.   Удаляется служебная и общепринятая лексика;

b.   Объединяются грамматические формы одного и того же слова;

c.   Объединяются синонимы;

d.   Удаляются слова, встреченные только в одном абзаце;

- Словарь потенциальных опорных слов делится (с помощью Кважн) на

a.   Словарь главных опорных слов;

b.   Словарь второстепенных опорных слов;

- Строится аннотация, составленная из слов-реляторов со следующими за ними ключевыми словосочетаниями, состоящими из главного опорного слова и определения.


Вопрос 20.

Системы машинного перевода

Перевод – вид человеческой языковой деятельности, в результате которой текст на одном языке ставится в соответствие тексту на другом языке при обеспечении их смысловыми эквивалентами.

Типы перевода по степени автоматизации:

1)  Ручной

2)  Автоматизированный

а)    Перевод, выполняемый ПК с помощью человека (ПК обращается за справками к человеку);

б)    Перевод, выполняемый человеком с помощью ПК:

- В памяти ПК двуязычный словарь и текстовый редактор;

- Системы ТМ ( Translation Memory) – в их основе лежит принцип сбора и хранения фрагментов переведённых человеком текстов на 2 языках, они хранятся в специальном накопителе перевода и служат бесценным подспорьем при последующем выполнении переводов той же тематики.

3)  Машинный (автоматический) – выполняемое ПК действие по преобразованию текста на одном языке в текст на другом языке при сохранении эквивалентности).

·    Традиционный (выполненный человеком)

·    Статистический (машинный)

Первые теоретические разработки по машинному переводу относятся к 30-40-м, но практическое применение идея машинного перевода нашла в 50-е. Первый машинный перевод был выполнен в Джорджстаунском университете в 1954. В Москве первый  машинный перевод был выполнен в 1955. Так как большинство слов имеют несколько значений, то основная трудность заключается именно в выборе нужного варианта, для чего человек использует контекст, жизненный опыт, который фактически невозможно формализовать и загрузить в ПК, => идеального машинного перевода быть не может и человек постоянно участвует в редактировании текста.


Вопрос 21.

Типы систем МП:

1)  На правилах языка (модель перевода человеком)

а)    Структуры систем МП, основанных на первой системе:

 


- В процессе морфологического анализа слов предложения исходного языка каждое слово получает наборы лексико-грамматических признаков ( часть речи, род и т.д.), ПК формирует эти наборы с опорой на специализированные двуязычные словари;

- Синтаксический анализ предложения исходного языка сводится к поиску основных членов предложения;

- Синтаксический синтез заключается:

a.   В создании предложения переводного языка определённой синтаксической структуры, определяемой правилами языков;

b.   Замена слов исходного языка на их переводные эквиваленты из словарей.

- Морфологический синтез каждого слова предполагаемого родного языка сводится к постановкам каждого слова в нужную форму, для чего ПК использует лексико-грамматические признаки слов переводного языка.

б)    Успех СМП зависит от автоматических словарей. Для всех слов закодированного вида указываются грамматические признаки и лексико-семантическая информация.

в)    Используются два типа представления лексических единиц в автоматическом словаре:

- В виде словоформ (словарь включает всевозможные лексические единицы и подаётся гнёздами);

- В виде квазиосновы ( числа, стоящие после, условно обозначают наборы суффиксов и окончаний, присоединяемых к основе для получения соответствующей формы, эти числа называются типами формообразования, а сами суффиксы и окончания – машинными окончаниями.

г) Выбор типа лексической единицы зависит от:

- Типа языка (для флективных рациональнее использовать квазиоснову, для языков аналитического типа - словоформу);

- От объёма словаря и вычислительных ресурсов ПК;

- От типа системы СМП (для информативного перевода применяют квазиосноу, для профессионального – словоформу).

д)    Преимущества систем первой технологии:

- Синтаксическая и морфологическая точность;

- Стабильность и предсказуемость результатов;

- Возможность настройки на предметную область.

е)    Недостатки:

- Трудоёмкость и длительность разработки;

- Необходимость пополнения словарей;

- «Машинный» акцент.

2)  Системы второй технологии (основаны на поиске наиболее вероятного перевода с использованием данных из параллельных корпусов);

а)    Преимущества:

- Легко построить при наличии двуязычного корпуса;

- Перенос технологии на любые пары языков

- Лексическая гладкость.

б)    Недостатки:

- Ограниченность параллельных корпусов и их качество;

- Плохая справляемость с морфологией и синтаксисом;

- Искажение информации.

Обе технологии обладают своими преимуществами и недостатками и не решили задачу по достижению качественного МП. Система Promt разработала «Гибридную технологию перевода». Такой перевод сохраняет преимущества традиционной технологии (формирование синтаксически связанного и грамматически правильного текста) и преимущества статистического метода (быстрое обучение, получение данных из параллельных корпусов в автоматическом режиме и гладкость текстов).


Вопрос 22.

Понимание и порождение устной и письменной речи с помощью ПК

Пока ПК, обладающие возможностью обрабатывать письменные тексты и устную речь, имеют в памяти ограниченные конкретной предметной областью базы знаний.

База знаний – определённым образом организованные лингвистические и нелингвистические данные и правила их обработки.

Речемыслительная деятельность человека – очень сложный и неизученный до конца процесс, поэтому сегодня нельзя говорить о его полном моделировании на ПК.

Существующие экспериментальные промышленные системы обработки текста и речи созданы с учётом наложения определённых ограничений на их функционирование. Созданы для решения частных задач.

Компьютерные системы понимания связного текста:

Проблема понимания текста ПК находится на начальный стадии изучения. Разные точки зрения на эту проблему, разные уровни понимания, построены различные системы понимания текста. Наиболее сложным для понимания являются тексты, описывающие взаимоотношения и поступки действующих лиц, так как в ПК должны храниться большие базы данных об окружающем мире. Более простые – тексты с описанием объектов статического мира. Понимание в таких системах трактуется как извлечение из текста наиболее существенной информации. Полученная в результате информация может пополнить базу данных ПК или быть отправлена пользователю.

Под передачей пользователю понимают способность ПК отвечать на вопросы пользователя относительно событий в тексте не в виде слов иди предложений, а в виде связного текста. Согласно современным теориям автоматического понимания текста ПК понял текст, если он может:

1)  Кратко изложить его содержание;

2)  Отвечать на вопросы к этому тексту;

3)  На основе текста создать картинкусхему и т.д.;

4)  Приведённые в тексте сведения представить в иной форме (таблицы, графика);

5)  На основе анализа текста на одном языке выдать адекватную информацию на другом языке;

6)  Сравнить содержание двух разных текстов и выдать информацию об их сходствах и различиях;

7)  Путём анализа одного или нескольких текстов извлечь некие знания, которые можно было бы поместить в базу данных.

Уровни понимания письменного текста (выделяются при соотнесении с основными уровнями языка):

а) Морфологический – сводится к автоматическому приписыванию каждому слову его морфологических характеристик (наиболее освоенный вид понимания текста), в последние годы стал легко реализовываться в рамках лексико-грамматического анализа корпусов текстов;

б)    Синтаксический – суть в автоматическом выделении в каждом предложении текста членов и установлении между ними различных типов связей;

в)    Семантический – в процессе автоматически устанавливаются значения выделенных на синтаксическом уровне составляющих предложений. ПК определяет, выражаются ли подлежащее одуш.неодущ. Существительным, сказуемое глаголом движениячувств, обстоятельство времени/места. Подобные процедуры идут с опорой на окружение слова.

г) Гиперсинтаксический (прагматический) – выяснение семантических отношений между предложениями текста и выявлением соответствующей тексту ситуации реальной действительности.


Вопрос 23.

ПК, понимающий письменный текст, должен иметь в своей базе данных:

1)  Знания о языке текста;

2)  Правила использования этих знаний;

3)  Знания о реальном мире (конкретной предметной области);

4)  Правила использования знаний о фрагменте реального мира;

5)  Знания о пользователе, желающем от ПК понимания текста.

Типы автоматического понимания:

1)  Понимание-узнавание (в ПК есть лишь знания о языке) – суть в том, что ПК узнаёт морфологическую структуру каждого слова, проводит синтаксический анализ каждого предложения, узнаёт в исходном тексте ключевые слова, словосочетания и предложения);

2)  Понимание уподобление (ПК имеет знания о языке и правила их использования, считается, что система поняла текст, если она может ответить на вопросы по нему) – суть в нахождении готового ответа своей базе данных, ранее данных человеком, так как она уподобляется человеку;

3)  Понимание-прогнозирование (ПК ориентированы на понимание текстов узкой специальности, должны иметь знания о языке, правилах их использования и предметной области.) - считается, что система поняла текст, если может определить, какой объект или событие предметной области соответствует фрагментам текста. Однако одним и тем же фрагментам текста могут соответствовать разные объекты, поэтому их соотношение можно определить лишь с определённой долей вероятности. Отсюда и прогнозирование).

4)  Понимание-объединение (в базе данных системы 4 вида вышеназванных знаний) – объединяя эти виды знаний, ПК должен уметь делать выводы, умозаключения по тексту, и объяснять, почему она сделала такой вывод (работа экспертных систем);

5)  Понимание-объяснение (в ПК есть все 5 видов вышеназванных знаний) – ПК должен уметь объяснить пользователю, как она поняла текст. Так как система должна дать ответ любому пользователю с учётом уровня его образования, используется диалог «ПК->пользователь».

Сегодня проблема автоматического понимания текста реализована в:

1)  Автоматических системах реферирования и аннотирования и перевода текста;

2)  Информационных и информационно-поисковых системах;

3)  Экспертных системах.


Вопрос 24.

Системы автоматического порождения письменного текста:

Занимаются с 70-х, однако нет единой теории текстообразования, не может быть создана единая теория порождения текста из-за неоднозначного определения понятия «текст»:

1)  Создатели диалоговых систем под текстом понимают любую реплику из нескольких слов;

2)  Создатели систем генерации метеосводок или статистических отчётов понимают под текстом некоторую таблицу;

3)  Создатели инструкций понимают под текстом цепочку несвязанных между собой предложений, относящихся к одному объекту.

Этапы порождения текста:

1)  Стратегический (решение, что писать) – результат: семантическое представление будущего текста;

2)  Тактический (решение, как писать) – результат: собственно текст в языковой форме.

Виды компьютерных систем порождения текста:

1)  Системы, работающие на основе шаблонных технологий (строят будущий текст, манипулируя готовыми предложениями и словосочетаниями как строительными блоками; просты и надёжны, находят широкое промышленное применение; содержание порождённого текста представляется в виде фрагментов текстов, созданных ранее людьми, поэтому выглядит естественно, однако работает только с жёсткими типами текстов);

2)  Системы, работающие на основе лингвистически мотивированных технологий (для создания текста системе нужны сложные знания структуры содержания создаваемого текста и сложные лингвистические знания, которые позволяют выразить содержание языковыми средствами; промышленных систем такого рода нет).


Вопрос 25.

Общая структура системы порождения письменного текста:

а)    Оболочка: определяет назначение порождающей системы (диалог, сказка, стих и т.д.), содержит базу данных из 2 частей:

- Нелингвистическая (понятия, связи, отношения между понятиями конкретной предметной области);

- Лингвистическая (формализованные сведения о конкретном языке):

a.   Списки морфем;

b.   Слова с лексикой;

c.   Синтаксические структуры предложения;

d.   Семантико-синтаксические структуры абзацев и всего текста;

б)    Планировщик выполняет функции:

- Определяет ту информацию, которая должна быть в тексте;

- Определяет, как она будет представлена;

- Определяет порядок следования абзацев;

- Устанавливает порядок следования синтаксических составляющих в пределах текста;

- Осуществляет языковое оформление взаимосвязи предложений в тексте;

- Осуществляет построение синтаксических структур предложений текста;

- Осуществляет выбор соответствующей лексики.

в)    Лингвистический реализатор обеспечивает грамматическую правильность текста и принимает все окончательные грамматические и морфологические решения.


Вопрос 26.

Системы распознавания речи

Данной проблемой учёные занимаются около 70 лет, первая промышленная система была создана в Японии второй половине 80-х, её называли системой надиктовки текста в ПК (диктографами), данная система имела узкую специализацию.

Под распознавание речи ПК понимают такое распознавание, которое подробно восприятию речи человеком, в любых условиях и при общении с любым человеком.

Решению проблемы мешает:

1)  Отсутствие чётких теоретических представления, которые описывали бы весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов;

2)  Обладание слитно произнесённой речью:

3)  Размытой границы слов:

4)  Влияния соседних звуков друг на друга;

5)  Нечётким выговором и даже исчезновением функциональных слов;

6)  Наличие в голосе говорящего экстралингвистической информации, указывающей на пол, возраст и т.д.;

7)  Большое значение в процессе речевого общения паралингвистических средств коммуникации:

а)    Кинесика (мимика, жесты);

б)    Фанация (характеристика голоса);

в)    Проксемика (расстояние между людьми).

Поэтому сегодня АРР может осуществляться только при определённых ограничениях:

1)   Распознавание изолированно произнесённых слов;

2)   Распознавание речи с настройкой на голос пользователя;

3)   Распознавание с опорой на небольшой, заранее определённый словарь.

IBM – лидер в продуктах такого рода с системой ViaVoice (140 слов в минуту). Популярной системой надиктовки является DragonSystem.

Алгоритм распознавания:

1.  Ввод устной речи, обработка данных (убор шумов);

2.  Деление звукового потока на сегменты;

3.  Выделение в каждом сегменте минимальной акустической единицы – слова;

4.  Сравнение выделенных единиц с эталонами.

Промышленные системы распознавания речи условно делятся на 4 группы:

1. Средства речевого управления (ПК, телефон);

2. Средства надиктовки текста;

3. Информационно-справочные системы в диалоговом режиме в качестве автоответчика;

4. Средства идентификации человека по образцу речи.


Вопрос 27.

Системы автоматического синтеза речи

Методы:

1)  Кодирование (запись в двоичной системе речевых сигналов с их последующим восстановлением)

а)    По существу ПК здесь служит устройством для записи речи, слова и фразы записываются в ПК заранее и в нужный момент воспроизводятся по командам);

б)    Недостаток:

- Сказать фразу, не введённую в память, нельзя;

- Для хранения речевых сигналов в непосредственной форме нужен большой объём памяти;

в)    Преимущества:

- Естественное звучание речи;

- По качеству речь приближается к человеческой;

2)  Фонетический синтез речи (акустическое моделирование голосового тракта человека)

а)    Синтезатор по этому методу принципиально отличается от синтезатора по первому методу – имеет неестественное звучание, говорит голосом робота;

б)    Обычно осуществляется по орфографическому тексту, написанному человеком, ПК в нём умеет преобразовывать буквы в фонемы, фонемы в аллофоны и синтезировать непрерывный речевой сигнал с использованием аллофонов диктора, выбираемых и базы данных;

в)    Наиболее перспективен, так как речь генерируется действительно самим ПК.

3)  Математическое моделирование голосового тракта человека:

а)    Словарь в синтезаторе этого вида, как и в первом методе, создаётся с участием человека, но здесь в память записываются не слова и фразы, а производится выделение числовых характеристик звуков речи и интонации фраз, что позволяет уменьшить объём требуемой памяти.

б)    Речь естественна, для её генерации числовые характеристики по специальным командам преобразуются в звуковые сигналы.

Сейчас ведутся разработки над тем, чтобы синтезированная речь была звучала живо, эмоционально, естественно. Решение этой проблемы позволит создавать системы синхронного перевода, активнее использовать ПК при обучении языку, а также людям с нарушениями зрения.


Вопрос 28.

Базы данных (БД) и лингвистические информационные ресурсы (ЛИР)

БД – совокупность определенным образом упорядоченных сведений о некоторых объектах.

Объекты - это сведения, факты, события, процессы. Объект может быть материальным (студент, товар, машина) и нематериальным (событие - поход в цирк, процесс - перевод текста, факт - поступление в университет). В жизни каждый объект обладает определенными свойствами или атрибутами (вес, скорость, цвет), которым приписываются определенные значения: батон весит 400 гр., скорость машины 90 км./ч.

В БД атрибуты представляются элементами данных или просто данными, а их значения – значения данных.

Таким образом, данное – это некоторый показатель, который характеризует заданный объект и принимает для конкретного элемента объекта некоторое значение. Группа данных, которая образует одну строку, называется записью. Если несколько записей имеют одно и тоже множество данных с однотипной информацией то говорят, что эти записи имеют один формат. Множество записей с одним форматом называют файлом. А множество файлов образуют базу данных.

Основные функции БД

1)  Поиск информации в БД

2)  Модификация информации, находящейся в БД:

а)    добавление;

б)    удаление

в)    редактирование

Системы управления базами данных (СУБД)

СУБД – совокупность программных средств, позволяющих осуществлять создание и ведение базы данных..

Типы СУБД:

1.  Настольные СУБД по степени сложности подразделяются:

а) СУБД для обработки небольших объемов информации (MS OUTLOOK)

б) СУБД, ориентированные на пользователя, не умеющего программировать (EXCEL, LOTUS)

в) Сложные СУБД, ориентированные на разработку приложений (Fox Base, MS Access)

2.  Серверные СУБД – используют архитектуру “клиент-сервер”, т.е. осуществляют централизованное хранение и обработку данных (Informix, MS SQL Server).

Основные функции СУБД

1)  Обеспечить создание структуры БД (определить, какая информация будет храниться, какие атрибуты, типы данных)

2)  Модификация информации, находящейся в БД:

а)    добавление;

б)    удаление

в)    редактирование

3)   Поиск информации


Вопрос 29.

ЛИР -  совокупность данных хранящихся на ПК.

Лингвистические информационные ресурсы – одна из составляющих информационных ресурсов. Под информационным ресурсом понимают некоторый интеллектуальный ресурс, результат коллективного творчества

К пассивным формам информационных ресурсов относят книги, журналы, газеты, словари, энциклопедии, патенты, базы и банки данных и т.п.

Активные формы включают алгоритмы, модели, программы, базы знаний

В самом общем виде ЛИР – это своеобразная лингвистические БД, которые можно обновлять и в которых можно искать ту или иную информацию. Лингвистические ресурсы необходимы как пользователям ПК, так и различным компьютерным системам, связанным с обработкой текста речи: реферирования, аннотирования и перевода текстов, автоматического анализа текста, синтеза речи и текста.

Пассивные лингвистические информационные ресурсы включают:

1)  Письменный лексикон представлен одноязычными и многоязычными лексиконами. В общем смысле словарь - это справочная книга, которая содержит слова (морфемы, словосочетания, идиомы и т.п.), расположенные в определенном порядке (различном в разных типах словарей). В нем может содержаться толкование значения описываемых единиц, а также различная информацию о них. Любой словарь может быть представлен в виде реляционной БД

а)    частотно-алфавитный словарь словоформ какого-либо текста – простейшая лингвистическая БД;

б)    словоуказательболее сложная БД. В ней, кроме абсолютной частоты употребления словоформы в тексте, указываются номера страниц и строк на странице, где встретилась данная словоформа.

в)    конкордансыещё более сложный тип БД. В них каждая словоформа текста характеризуется не только численными показателями (частотой, номером страницы, номером строки и т.д.), но и некоторым контекстом, в котором она употреблена. Как правило, этот контекст состоит из 3-х предложений: предложения, в котором встретилась словоформа, предложения, стоящего перед основным предложением, и предложения, стоящего после него

г) энциклопедиисловари, содержащие характеристики не слова как такового, а обозначенного им предмета, факта или явления. Существует достаточно большое число различных энциклопедий на машинных носителях информации. Наиболее известна среди них энциклопедия "Britannica". Она включает 82000 статей и 700 дополнительных материалов, опубликованных с 1768 года. Не менее известны французские энциклопедии "Tons les savoire du Monde", "Le monde sur CD-ROM", "Versailles" и др. На русском языке издана "Большая Энциклопедия Кирилла и Мефодия

д)    тезаурус - принципиально иной тип словарей. В нем в явном виде указаны семантические связи между определенной частью его лексических единиц. Как правило, такие словари строятся для текстов достаточно узкой проблемной области: вычислительной техники, музыки, кораблестроения, сельского хозяйства и т.д.

е)    терминологическим словарь (ТС) – словарь, основной единицей которого является термин.
Термин - это слово или подчинительное словосочетание, имеющее специальное значение, выражающее и формирующее профессиональное понятие и применяемое процессе познания и освоения научных и профессионально-технических объектов и отношений между ними.


Вопрос 30.

ЛИР -  совокупность данных хранящихся на ПК.

Лингвистические информационные ресурсы – одна из составляющих информационных ресурсов. Под информационным ресурсом понимают некоторый интеллектуальный ресурс, результат коллективного творчества

К пассивным формам информационных ресурсов относят книги, журналы, газеты, словари, энциклопедии, патенты, базы и банки данных и т.п.

Активные формы включают алгоритмы, модели, программы, базы знаний

В самом общем виде ЛИР – это своеобразная лингвистические БД, которые можно обновлять и в которых можно искать ту или иную информацию. Лингвистические ресурсы необходимы как пользователям ПК, так и различным компьютерным системам, связанным с обработкой текста речи: реферирования, аннотирования и перевода текстов, автоматического анализа текста, синтеза речи и текста.

2)  Письменный текстовый массив (корпус текстов, т.е. совокупность текстов, являющаяся достаточной для обеспечения надежных научных выводов о некотором языке, диалекте или ином другом подмножестве языка).

а)    Могут быть использованы:

- В лексикографии и лексикологии (для составления различных словарей, определения значений многозначных слов, выявления ассоциативных связей слов в тексте, выделения терминов и терминологических словосочетаний и т.п.).

-  В грамматике (для определения частоты употребления грамматических морфем в текстах различного типа, выявления наиболее употребляемых типов словосочетаний и предложений, определения значений синонимичных морфологических единиц, частоты употребления классов слов и т.д.).

- В лингвистике текста (для дифференциации типов текста, создания конкордансов, выявления связи между предложениями в абзацах и между абзацами «т.д.).

- При автоматическом переводе текстов (для поиска контекстов слов, имеющих несколько переводных эквивалентов, поиска переводных эквивалентов терминологических и фразеологических словосочетаний в параллельных текстах и т.д.).

- В учебных целях (для выбора цитат, отдельных фрагментов произведений, примеров, используемых в процессе создания учебников и учебных пособий.

б)    таггированные корпусы текстов (от англ, tag - "индекс, помета"). Все слова такого корпуса получают некоторые буквенные или цифровые индексы, которые обозначают их грамматические, лексические, семантические или структурные признаки. Таких индексов может быть несколько.

3)  Фонетические лингвистические ресурсы
В настоящее время общепринято, что для создания машиночитаемых фонетических корпусов используется транскрипция на основе орфографического представления звуков речи с дополнительными знаками, передающими (при необходимости) просодические, паралингвистические и другие особенности произношения.

а)    Фонетические корпусы текстов широко используются для решения следующих задач:

- сопоставительного изучения устной и письменной форм языка;

- изучения грамматических и лексических особенностей устной речи;

- исследования фонетических особенностей диалектов;

- построения частотных списков фонем и их сочетаний;

- изучения акустических свойств речевых единиц и их использования в психолингвистических и лингвистических экспериментах;

- создания компьютерных систем, распознавания и синтеза устной речи.

Информация о файле
Название файла Шпаргалки по информационным техологиям от пользователя Гость
Дата добавления 17.5.2020, 16:59
Дата обновления 17.5.2020, 16:59
Тип файла Тип файла (zip - application/zip)
Скриншот Не доступно
Статистика
Размер файла 162.41 килобайт (Примерное время скачивания)
Просмотров 450
Скачиваний 98
Оценить файл