Универ

Library

Статистический анализ текстов различных авторов на основе их морфологических характеристик

Диссертации На Английском Языке

Содержание


Введение

1. Сбор и подготовка данных

2. Двухфакторный дисперсный анализ

2.1 Часть речи: имя существительное

2.2 Часть речи: глагол

2.3 Часть речи: имя прилагательное

2.4 Служебные части речи

Заключение

Введение


Сегодня одной из актуальнейших задач издательского дела является моделирование и оптимизация редакционно-издательских процессов. Математическое моделирование типовых технологических процессов используется для статистического анализа и прогнозирования с целью обеспечения эффективной работы издательства.

Основой данного курсового проекта является статистический анализ текста на основе его морфологических характеристик. То есть в каком-либо произведении выбирается по три отрывка величиной ровно в 100, 200, 300, 400 и 500 символов. Произведений различных авторов должно быть три, соответственно в сумме будет проанализировано 15 отрывков. В каждом отрывке необходимо подсчитать количество существительных, прилагательных, глаголов и служебных частей речи - то есть проанализировать текст с морфологической точки зрения. При этом остальные части речи также составляют определенный процент от общего объема, но в дальнейших расчетах не участвуют.

Морфологический состав текста рассматривается в зависимости от двух факторов: объема текстового отрывка и авторского стиля. Сбор и анализ статистических данных осуществляется на основе метода дисперсионного, или вариантного, анализа, разработанного английским математиком и биологом Робертом Фишером для нужд биологической статистики.

1. Сбор и подготовка данных


Влияние тех или иных факторов никогда не может быть выделено в чистом виде. Объясняется это тем, что на результаты опытов влияют многочисленные случайные обстоятельства, факторы, меняющиеся от опыта к опыту и не поддающиеся контролю. Метод дисперсного анализа позволяет учесть влияние и основных факторов, и множества случайных, неконтролируемых.

Для проведения дисперсного анализа было подсчитано количество разных частей речи (существительных, глаголов, прилагательных и служебных) - так называемые варианты, - в отрывках из 3 произведений: "Ева Луна" Исабель Альенде, "Вторая попытка. Управление случайностями" Катерины Тильман и "Ледяной дворец" Френсиса Скотта Фицджеральда.

Для анализа влияния объема текста из каждого произведения было взято 15 отрывков величиной 100, 200, 300, 400 и 500 символов. Причем на каждый объем приходится по три разных отрывка - для определения отклонения в группе. Для анализа влияния авторского стиля были изучены произведения трех авторов. В совокупности собранные данные использовались для описанного ниже двухфакторного дисперсного анализа.


Таблица 1.1

Текст 1. Исабель Альенде, "Ева Луна"

СимволыОтрывок100Меня зовут Ева, что означает жизнь, по крайней мере, так было написано в книге, по которой мама выбиСначала их путь на каноэ лежал по бесконечным притокам огромной реки, через умопомрачительные, подавОна отказывалась верить, что жалкое, чахлое солнце, освещавшее монастырский двор, и есть то самое не200Я родилась в самой дальней комнате темного, сумрачного дома и росла среди старой мебели, книг на латыни и человеческих мумий, что, впрочем, не смогло привить мне склонности к меланхолии, ибо появиласьВремя в тех краях течет неравномерно, расстояния обманчивы и само пространство искривлено: неопытный путешественник будет ходить там по кругу, раз за разом возвращаясь к исходной точке своего пути. ГуПодплывая к деревне, любой путешественник мог еще издалека разглядеть Консуэло: ее рыжие волосы языком пламени плясали на фоне вечной зелени окружающей деревню сельвы. Ее товарищами по детским играм б300 Мой отец, индеец с янтарными глазами, был родом из тех краев, где сливаются воедино сто рек; от него пахло лесом, а еще он никогда не смотрел на небо прямо и открыто, поскольку вырос под сводчатым потолком джунглей и подсматривать за обнаженным небом казалось ему почти непристойным. Консуэло, моя маНеподвижная, то и дело бледнея от бушующих в ее голове мыслей и образов, сложив на груди руки, Консуэло часами неподвижно стояла перед алтарем в часовне; монахини стали даже поговаривать о том, что девочка блаженная, что ее посещают божественные видения; впрочем, по мнению матери-настоятельницы, катЭтому человеку предстояло стать единственным хозяином в жизни Консуэло; сам он долгие годы занимался разработкой и совершенствованием методики бальзамирования и консервации тел умерших: человечество даже не догадывается, какую услугу оказал ему профессор Джонс, унеся эту тайну с собой в могилу. Кром400От нее требовали присутствовать на службах, помогать и время от времени посещать уроки чтения, арифметики и катехизиса; все остальное время она познавала мир так, как считала нужным: флору она постигала на вкус и на запах, за фауной гонялась, насколько хватало сил и ловкости, а воображение и память ее наполняли бесчисленные образы, цвета и ароматы, сказки и истории, мифы и легенды, принесенные рекЕй было 12, когда она познакомилась с одним человеком - закаленным солнцем и непогодой португальцем, на первый взгляд сухим и суровым, но полным внутреннего света и радости. Он повсюду с собой таскал кур, которые отличались невероятной, даже по куриным меркам, страстью ко всему блестящему: как мародеры в захваченной деревне, они жадно склевывали все яркое и сверкающее, что попадалось им наСледуя той же логике, он провел множество экспериментов по исследованию воздействия ударов разной силы по головам подопытных - слабоумных с рождения или по призванию; эти исследования он проводил на основании статьи, вычитанной в одном из номеров "Эскулапа", где описывался курьезный с точки зрения медицины случай: якобы кто-то где-то после мозговой травмы превратился из заурядного человека в гения500Как только Консуэло удалось побороть в себе страх от первой встречи с профессором и принять мясницкий фартук и могильный запах, исходивший от хозяина, как неотъемлемые, но незначительные детали его образа, она почувствовала себя в его особняке как дома. Сам он оказался вполне сносным человеком, легкоранимым, а порой вызывающим что-то вроде сочувствия или даже симпатии. В общем, по сравнению с монастырем жизнь в доме профессора показалась Консуэло раем: здесь никому и в голову не приходило вставаДом был набит книгами: стеллажи и книжные шкафы превращали внутреннее пространство в настоящий лабиринт. Книжные полки тянулись практически по всем стенам от пола до потолка: бесконечные ряды томов в кожаных переплетах поражали воображение; блестящие полупрозрачные страницы, золотые обрезы и тисненые буквы названий - казалось, на этих полках представлена в печатной форме вся мудрость, накопленная человечеством. Книги стояли на полках в полном беспорядке: профессор без всякой системы, без всякогоДевушка аккуратно брала в руки каждый том, нежно, словно лаская, стирала с него пыль и позволяла себе роскошь на пару минут погрузиться в неведомый внутренний мир незнакомой книги, открыв ее наугад, на первой попавшейся странице. Мало-помалу она стала узнавать те книги, что уже попадались ей в руки, и постепенно запомнила тот порядок, в котором они располагались на полках. Она так и не решилась попросить у хозяина разрешения брать книги к себе в комнату и читать. По вечерам она тайком снимала ка

Таблица 1.2

Содержание некоторых частей речи в тексте 1, слов и %

Символы№Всего словСуществительныеГлаголыПрилагательныеСлужебные ч. р. ЧислоПроцентЧислоПроцентЧислоПроцентЧислоПроцент100118527,8316,715,6527,8214428,617,1321,4321,4315213,3320,0320,0213,3200131825,8516,1516,1929,0229827,6310,3310,3413,83291241,4310,3310,3310,33001491224,5714,336,11326,52441534,149,124,51227,33411843,9512,224,9819,54001622235,51016,134,81727,42591220,3610,2711,91830,53562137,547,1610,71628,65001752128,079,368,02330,72672740,369,01116,41319,43811923,51417,333,72125,9

Таблица 1.3

Текст 2. Катерина Тильман, "Управление случайностями. Вторая попытка"

СимволыОтрывок100К примеру, в крупном городе раз в пять дней раздается выстрел. Так утверждает статистика. Но если тыВопреки ожиданиям, Диана не заявила, что лично для Юли раздельное обучение было бы несомненным благоЗаумные рассуждения всегда угнетали Юлю: на них трудно что-то возразить, даже когда понимаешь их вну200Но все-таки Юля пошла. Как бы там ни было, она не могла жить спокойно, не удовлетворив своего любопытства относительно грустных гремлинов, подсознания и прочих странностей. К тому же Юле показалось, чтНо держалась она всегда с достоинством и была очень интересной собеседницей. Юля обнаружила, что ее новая знакомая прекрасно знает историю, более того, умеет интересно о ней рассказывать - дар, которыКак-то воскресным утром Юля сидела на диване и ощущала себя глупой, мелкой и никому не нужной. Эти чувства появлялись у нее периодически, когда после каких-нибудь неприятностей она задумывалась о свое300С первых дней учебы в Политехническом Юля принимала участие в спектаклях студенческого театра. И, надо признать, это нравилось ей гораздо больше лекций и семинаров! И поэтому, узнав о предстоящем конкурсе любительских театров, Юля взволновалась чрезвычайно. С этой новостью она, не заходя домой, прибВстретившись, как обычно, с бывшими одноклассниками и друзьями детства, Юля порадовалась, но недолго. Чем дальше, тем заметнее становились различия: кто-то целеустремленно двигался вперед, предвкушая будущие успехи - и этим счастливцам было непросто понять тех, кто уже испытал разочарования или потеГоворят - человек жив надеждой, а если эту надежду у него отнять? Останется реальность… Но как недостаточно только надежды, так и недостаточно только реальности. Тонечка часто говорила: "Если ты поймешь, что у тебя осталось в жизни что-то одно, покончи c собой, пока это у тебя еще осталось, потому что400Юля боролась с этим, как могла - какого черта, ей только двадцать лет, еще рано разочаровываться в жизни! Она много читала, ходила в кино, поступила на курсы шитья, покупала билеты на концерты, соблазняла всех подряд, бывала на всех доступных вечеринках, ездила на выходные за город… Но все это давало только временное облегчение! Если бы Юле год назад кто-то сказал, что с ней случится такое, она смЮля с сомнением покачала головой. Романтик-идеалист в таких условиях обязательно кинулся бы в бой, а не отсиживался бы молча в углу! Нет, тут что-то другое… Но она не стала спорить с Тонечкой: какая разница, в конце-то концов, если знакомство все равно не состоялось! Ее волновало другое: почему все остальные вели себя так агрессивно? Странно это было для обычно спокойной и доброжелательной к новичНа столе стоял самый обыкновенный, но как-то очень значительно выглядевший стакан с остатками жидкости. Юле страшно было даже прикоснуться к нему… В первый момент ей захотелось убежать, но постепенно она успокоилась: смерть здесь еще была таинством, а не ужасом. Она ни на что не намекала, ни о чем не говорила - она просто была. Пришла за той, что сама позвала ее, и не собиралась пугать оставшихся. 500Вначале надо было просто смотреть. Юле никогда не приходилось стрелять, но теперь ей казалось, что именно так смотрят через прицел. Незнакомка ощутила взгляд, забеспокоилась. Остановилась, завертела головой… Потом продолжила путь по камням, но уже менее уверенно. А Юля начала повторять все ее движения, как бы отождествляя, "сливая" себя с нею. И когда девочка нерешительно остановилась на очередном камне, собираясь перешагнуть на другой, Юля одновременно с ее шагом резко дернулась вправо, имитируВначале не происходило ничего особенного: эсперы просто молча шли друг за другом по узкой тропинке, впрочем, шли очень быстро. Но скоро Юля поняла, что при таком ритме движения ходьба превращалась в наслаждение, необычное и даже опасное: малейшая неточность грозила падением вниз со склона. Юля устала от неожиданной стремительной прогулки, но надеялась, что не окажется слабее остальных. И действительно, когда эсперы остановились на берегу небольшого горного озера, почти все тяжело дышали и ощутимоЕвгений почувствовал, что попал в затруднительное положение - необходимость поддерживать "светскую беседу" и развивать знакомство по классическим канонам, да еще из служебных соображений, делала его глупее, чем он был на самом деле. Не помогала даже психология отношений, которой его учили два семестра… Он с досадой осознавал, что не знает самых элементарных приемов, известных любому начинающему ловеласу! Поэтому он даже обрадовался, когда Юля прямо спросила его, каким образом он выследил ее в Се

Таблица 1.4

Содержание некоторых частей речи в тексте 2, слов и %

Символы№Всего словСуществительныеГлаголыПрилагательныеСлужебные ч. р. ЧислоПроцентЧислоПроцентЧислоПроцентЧислоПроцент100117529,4211,815,9423,5215320,0213,3213,3426,7315213,3320,016,7320,0200131619,4516,126,51238,7229620,7620,726,9517,2330516,7413,3413,3826,73001431330,2511,649,31023,3239820,5615,425,1923,1348816,7816,712,11735,44001651523,11320,023,11523,12631015,9914,357,91828,6365913,81421,511,51929,25001711318,31723,922,81622,52721520,81115,31115,31825,03711419,71318,379,92028,2

Таблица 1.5

Текст 3. Френсис Скотт Ки Фицджеральд, "Ледяной дворец"

СимволыОтрывки100Мотор издал жалобное агонизирующее бормотание, наступила тишина, и воздух разрезал резкий свист. СонПод ноги ей попало блюдце с водой от красок, она чертыхнулась, но прибирать не стала и ушла из комнатыУбивать время оказалось совсем не трудным делом; прекрасно поднималась молодая девичья поросль, и вс200Она глубоко вздохнула и с великой неохотой поднялась с пола, где остались следы ее занятий - обкусанное яблоко и раскрашенные для сестренки бумажные куклы. Она подошла к зеркалу, не спеша и с удовольствиемОт пресыщенности женским обществом спасали приятели, которые собирались в самом скором времени заняться делом, а пока были всегда не прочь составить компанию в гольф или бильярд, посидеть за квартой пива.Здесь уже ехать было небезопасно - самое людное время; прохожие беспечно толкались на мостовой, с черепашьей скоростью тянувшийся трамвай гнал перед собой протяжно мычавшее стадо; казалось, и магазины300Дом был облит золотистой охрою, словно декоративная ваза, и редкие пятачки тени давали особенно почувствовать напор затопляющего света. Дома ближайших соседей прятались за высокими раскидистыми деревьями, а вот их дом стоял на самом солнцепеке и целый день с добродушным терпением караулил пыльную дорогуСонными глазами смотрела вниз Салли Кэррол. Ей захотелось зевнуть, но для этого требовалось поднять голову, и, подавив зевок, она продолжала молча созерцать автомобиль, между тем как его владелец, застыв в картинно скучающей позе, ждал ответа. В следующую минуту новый свист пронзил пыльное безмолвиеВремя от времени кто-нибудь из них перед отъездом делал прощальный обход друзей, но основную массу навсегда засасывал этот рай, где небо навевало грезы, сумерки высыпали светляков, на ярмарках шумели негры и, главное, где водились такие нежные, с мелодичными голосами девушки, прошедшие бесплатную школу400Сверху, из спальни, опустив на подоконник подбородок, девятнадцатилетняя Салли Кэррол Хэппер наблюдала за стареньким "фордом" Кларка Дарроу, свернувшим к их дому. Автомобиль дышал жаром, солнце и мотор нещадно накалили его металлические части, и сам Кларк Дарроу, со страдальчески-напряженным выражением оцепеневший за рулем, ощущал себя частью механизма, и притом весьма ненадежной. Под протестующийКларк был смуглый, поджарый, немного сутулился при ходьбе. У него был колючий взгляд и довольно неприветливое лицо, пока он не улыбнется, а улыбался он светло и часто. Кларк имел "доход", которого ему едва хватало на себя и на бензин, и, окончив технический колледж своего штата, он третий год сонно слонялся по мирным улочкам родного городка, делясь планами, как выгоднее поместить свой капитал.400Да, потому что я никогда не смогла бы выйти за тебя замуж. Никто не займет твоего места в моем сердце, но если я здесь останусь, я не буду знать покоя. У меня будет такое чувство, словно я заживо себя схоронила. Понимаешь, во мне две души. Ты любишь ту, которая все время спит; а на другую нет угомона, из-за нее я бываю как сумасшедшая. И в других краях она может мне пригодиться, и она будет при мн500Медленно опустив голову на спинку сиденья, она подставила пахучему ветерку полуприкрытые ресницами глаза и растрепавшиеся стриженые волосы. Они уже выехали из города, с обеих сторон их обступало изумрудное буйство кустарников и травы, высокие деревья осеняли дорогу милосердной крапчатой тенью. По пути попадались убогие негритянские хижины с обязательным седым стариком, курившим кукурузную трубку на порожке, и стайкой полуголых негритят, прогуливавших по некошеной траве перед домом.В ноябре из своего северного города приехал на несколько дней Гарри Беллами - высокий, широкоплечий, энергичный. В его планах было решить вопрос, остававшийся открытым с лета, со времени их встречи в Ашвилле. И вопрос решился быстро - хватило нескольких безмятежных полуденных часов и вечера у жаркого камина. Гарри Беллами подходил ей по всем статьям, не говоря уже о том, что она его любила, то есть предназначенной для этого стороной ее души он завладел всецело. А в душе Салли всему было свое местоОни прошли в ворота и по дорожке углубились в волнистую долину могил; пятидесятые годы лежали пепельно-серые неприбранные; семидесятые щеголяли причудливой лепкой цветов и урн; девяностые поражали воображение страховидной красотой - на каменных подушках тяжелым сном спали упитанные мраморные херувимы да свисали гирлянды безымянных гранитных цветов. Кое-где у холмиков стояли на коленях женщины с живыми цветами в руках, большинство же могил оставались непотревоженными, и прелые листья на них источник

Таблица 1.6

Содержание некоторых частей речи в тексте 3, слов и %

Символы№Всего словСуществительныеГлаголыПрилагательныеСлужебные ч. р. ЧислоПроцентЧислоПроцентЧислоПроцентЧислоПроцент100113646,2323,1215,417,7219421,1526,30 0,0736,8314321,4321,4321,417,1200132825,0412,526,3928,1230930,0826,726,7723,3327725,9518,527,4414,83001431432,6614,0920,9818,62431227,9920,949,3818,63431330,2614,0614,0818,64001522140,447,759,61121,22631422,2914,3711,11422,2376810,51519,722,62330,35001662436,457,61218,21116,72802227,5911,3810,02025,03672537,3913,41217,91420,9двухфакторный дисперсный существительное текст

2. Двухфакторный дисперсный анализ


2.1 Часть речи: имя существительное


Для выполнения двухфакторного анализа представим собранные данные в виде таблицы, чтобы выделить группы отрывков с равным объемом и с одинаковыми авторами, а также вычислим для каждой подгруппы и группы значения Tij, Ti, Tj, xij, xi, xj и x. Эти показатели значат: i - количество горизонтальных рядов (по фактору А), j - количество вертикальных столбцов (по фактору В), Tij - сумма вариант по отдельным клеткам (рядов и столбцов), Ti - сумма вариант для i-рядов - по уровням фактора А, Tj - сумма вариант для j-столбцов - по уровням фактора В, xij - среднее значение вариант в подгруппе, xi - среднее значение вариант в строке, xj - среднее значение вариант в столбце, x - среднее значение всех данных.

Подсчитанные данные также добавляются в таблицу. Для такой части речи, как имя существительное, она будет иметь следующий вид:


Таблица 2.1.1

Содержание существительных в различных текстах, %

Группы по фактору А (по объему отрывка) Группы по фактору B (по авторам) и отдельные наблюдения в нихСумма по группам объема Ti / среднее по группам объема xiИ. АльендеК. ТильманФ.С. ФицджеральдОбъем, символов№xijkTij / xijxijkTij / xijxijkTij / xij100127,869,7 / 23,2329,462,7 / 20,9046,288,7 / 29,57221,1/24,57228,620,021,1313,313,321,4200125,894,8 / 31,6019,456,8 / 18,9325,080,9 / 26,97232,5/25,83227,620,730,0341,416,725,9300124,5102,5 / 34,1730,267,4 / 22,4732,690,7 / 30,23260,6/28,96234,120,527,9343,916,730,2400135,593,3 / 31,1023,152,8 / 17,6040,473,1 / 24,37219,2/24,36220,315,922,2337,513,810,5500128,091,8 / 30,6018,358,8 / 19,6036,4101,2 / 33,73251,8/27,98240,320,827,5323,519,737,3Сумма по группам авторов Tj / среднее по группам авторов xj452,1/30,14298,5/19,90434,6/28,97x = 26,34

В таблице скомбинированы все данные, которые могут понадобиться при двухфакторном дисперсном анализе. Процентное содержание существительных в текстах неодинаково. Это может быть обусловлено как влиянием факторов А или В, так и случайными отклонениями. Целью дисперсного анализа и является выяснение ответа на вопрос, от чего же зависит количество разных частей речи.

В двухфакторном дисперсном анализе можно выделить 5 типов варьирования, так как определяется общее отклонение, влияние отдельно фактора А, отдельно фактора В, совместное влияние факторов А и В, а также случайные отклонения. Каждому из типов варьирования соответствует своя сумма квадратов отклонений. Поэтому первый этап анализа - вычисление суммы квадратов.

Общая сумма квадратов вычисляется по формуле:



где xijk - каждая варианта;

x - среднее значение вариант по всем данным.

Существует также значительно упрощенная рабочая формула:



где T - сумма Tij, равная;

n - число вариант в каждой подгруппе (равно 3);

c - количество групп по фактору В (равно 3);

r - количество групп по фактору A (равно 5).

Для существительных общая сумма квадратов отклонений по первой:



или по второй формуле составит:



Сумма квадратов отклонений для варьирования по фактору А:



где xi - среднее значение вариант в строке.

Рабочая формула будет иметь вид:



где Ti - сумма вариант для i-рядов - по уровням фактора А.

У существительных данная сумма квадратов по фактору А составит:



или по второй формуле:



Сумма квадратов отклонений для варьирования по фактору В:



где xj - среднее значение вариант в столбце.

Рабочая формула будет иметь вид:



где

Tj - сумма вариант для j-столбцов - по уровням фактора В.

Сумма квадратов по фактору В для существительных:



По рабочей формуле:



Сумма квадратов для взаимодействия А и В:



где xij - среднее значение вариант в подгруппе.

Рабочая формула варьирования, характеризующая взаимодействие А и В:



где Tij - сумма вариант по отдельным клеткам (рядов и столбцов).

Сумма квадратов отклонений под воздействием факторов А и В на существительные составит:



По рабочей формуле сумма квадратов отклонений под влиянием факторов А и В равняется:



Сумма квадратов отклонений вариант от групповых средних внутри каждой группы - иначе говоря, для случайной вариации внутри групп, - рассчитывается по формуле:



или равнозначной ей рабочей формуле:



Таким образом, сумма квадратов для случайных отклонений среди групп существительных будет равна:



или равнозначной ей рабочей формуле:



На следующем этапе анализа необходимо рассчитать степени свободы, которые понадобятся, чтобы найти средние квадраты ms (вариансы, дисперсии).

Для общей дисперсии число степеней свободы равняется:



для варьирования по фактору А:



для варьирования по фактору B:



для взаимодействия факторов А и В:



для случайной вариации значений внутри групп:



Средние квадраты необходимы для того, чтобы непосредственно измерить суммарную вариацию, ее контролируемый (под влиянием факторов) и неконтролируемый (обусловленный множеством случайных факторов) компоненты. Средние квадраты находятся делением сумм квадратов на соответствующие число степеней свободы.

Дисперсия общего варьирования в данном случае не нужна, так как она не повлияет на окончательный вывод. Дисперсия для варьирования по фактору А:



Дисперсия для варьирования по фактору В:



Дисперсия для взаимодействия факторов А и В:



Для случайных отклонений она составит:



Отношение каждой из варианс факторов А и В и вариансы случайных отклонений называется критерием Фишера. По нему производится оценка величины отклонения, то есть, в данном случае, зависимости количества существительных от объема, авторского стиля или обоих этих факторов одновременно. Полученное число сравнивается с табличным критерием Фишера для вычисленных степеней свободы, и, если оно больше, то можно утверждать, что фактор влияет на результат. Если же больше табличное значение, чем вычисленное, то фактор влияния не оказывает, а все отклонения случайны.

Критерий Фишера для влияния объема на количество существительных:



Для влияния стиля указанных авторов на количество существительных:



Для влияния 2 факторов одновременно на количество существительных:



Для сравнения возьмем критерий Фишера из таблицы V "Значения F при уровне значимости 0,05" из "Биологической статистики" Рокицкого П.Ф. [с.299-300] и сопоставим его с фактическим в таблице:


Таблица 2.1.2

Дисперсионный анализ данных о содержании существительных в различных текстах

Направление варьированияСумма квадратовЧисло степеней свободы dfСредний квадрат msF фактическоеF табличноеОбщее3385,7544---Влияние фактора А151,77437,940,562,69Влияние фактора В942,722471,366,903,32Влияние факторов А и В241,02830,130,442,27Случайные отклонения2050,243068,34--

Вывод: влияние объема текста на количество существительных в этих текстах не доказано; доказана зависимость между авторским стилем (И. Альенде, К. Тильман и Ф.С. Фицджеральда) и количеством существительных в текстах; данные факторы не оказывают совместного влияния на содержание указанной части речи в текстах.

Для других рассматриваемых частей речи анализ проводится также, как в приведенном примере.


2.2 Часть речи: глагол


Таблица 2.2.1

Содержание глаголов в различных текстах, %

Группы по фактору А (по объему отрывка) Группы по фактору B (по авторам) и отдельные наблюдения в нихСумма по группам объема Ti / среднее по группам объема xiИ. АльендеК. ТильманФ.С. ФицджеральдОбъем, символов№xijkTij / xijxijkTij / xijxijkTij / xij100116,743,8 / 14,6011,845,1 / 15,0323,170,8 / 23,60159,7/17,7427,113,326,3320,020,021,4200116,136,7 / 12,2316,150,1 / 16,7012,557,7 / 19,23144,5/16,06210,320,726,7310,313,318,5300114,335,6 / 11,8711,643,7 / 14,5714,048,9 / 16,30128,2/14,2429,115,420,9312,216,714,0400116,133,4 / 11,1320,055,8 / 18,607,741,7 / 13,90130,9/14,54210,214,314,337,121,519,750019,335,6 / 11,8723,957,5 / 19,177,632,3 / 10,77125,4/13,9329,015,311,3317,318,313,4Сумма по группам авторов Tj / среднее по группам авторов xj185,1/12,34298,5/19,90434,6/28,97x = 15,30

Таблица 2.2.2

Дисперсионный анализ данных о содержании глаголов в различных текстах

Направление варьированияСумма квадратовЧисло степеней свободы dfСредний квадрат msF фактическоеF табличноеОбщее1155,7044---Влияние фактора А90,89422,721,152,69Влияние фактора В197,75298,874,993,32Влияние факторов А и В272,70834,091,722,27Случайные отклонения594,363019,81--

Вывод: влияние объема текста на количество глаголов в этих текстах не доказано; доказана зависимость между авторским стилем (И. Альенде, К. Тильман и Ф.С. Фицджеральда) и количеством глаголов; оба фактора не оказывают совместного влияния на содержание глаголов в текстах.


2.3 Часть речи: имя прилагательное


Таблица 2.3.1

Содержание прилагательных в различных текстах, %

Группы по фактору А (по объему отрывка) Группы по фактору B (по авторам) и отдельные наблюдения в нихСумма по группам объема Ti / среднее по группам объема xiИ. АльендеК. ТильманФ.С. ФицджеральдОбъем, символов№xijkTij / xijxijkTij / xijxijkTij / xij10015,647,0 / 15,675,925,9 / 8,6315,436,8 / 12,27109,7/12, 19221,413,30,0320,06,721,4200116,136,7 / 12,236,526,7 / 8,906,320,4 / 6,8083,8/9,31210,36,96,7310,313,37,430016,115,5 / 5,179,316,5 / 5,5020,944,2 / 14,7376,2/8,4724,55,19,334,92,114,040014,827,4 / 9,133,112,5 / 4,179,623,3 / 7,7763,2/7,02211,97,911,1310,71,52,650018,028,1 / 9,372,828,0 / 9,3318,246,1 / 15,37102,2/11,36216,415,310,033,79,917,9Сумма по группам авторов Tj / среднее по группам авторов xj154,7/10,31109,6/7,31170,8/11,39x = 9,67

Таблица 2.3.2

Дисперсионный анализ данных о содержании прилагательных в различных текстах

Направление варьированияСумма квадратовЧисло степеней свободы dfСредний квадрат msF фактическоеF табличноеОбщее1443,0444---Влияние фактора А159,96439,991,372,69Влияние фактора В134, 19267,102,303,32Влияние факторов А и В273,86834,231,172,27Случайные отклонения875,023029,17--

Вывод: на количество прилагательных в этих текстах влияние объема отрывка не доказано; также не доказана зависимость между авторским стилем (И. Альенде, К. Тильман и Ф.С. Фицджеральда) и количеством прилагательных; оба фактора не оказывают совместного влияния на содержание глаголов в текстах.

2.4 Служебные части речи


Таблица 2.4.1

Содержание служебных частей речи в различных текстах, %

Группы по фактору А (по объему отрывка) Группы по фактору B (по авторам) и отдельные наблюдения в нихСумма по группам объема Ti / среднее по группам объема xiИ. АльендеК. ТильманФ.С. ФицджеральдОбъем, символов№xijkTij / xijxijkTij / xijxijkTij / xij100127,862,5 / 20,8323,570,2 / 23,407,751,6 / 17, 20184,3/20,48221,426,736,8313,320,07,1200129,053,1 / 17,7038,782,6 / 27,5328,166,2 / 22,07201,9/22,43213,817,223,3310,326,714,8300126,573,3 / 24,4323,381,8 / 27,2718,655,8 / 18,60210,9/23,43227,323,118,6319,535,418,6400127,486,5 / 28,8323,180,9 / 26,9721,273,7 / 24,57241,1/26,79230,528,622,2328,629,230,3500130,776,0 / 25,3322,575,7 / 25,2316,762,6 / 20,87214,3/23,81219,425,025,0325,928,220,9Сумма по группам авторов Tj / среднее по группам авторов xj351,4/23,43391,2/26,08309,9/20,66x = 23,39

Таблица 2.4.2

Дисперсионный анализ данных о содержании служебных частей речи в текстах различного объема

Направление варьированияСумма квадратовЧисло степеней свободы dfСредний квадрат msF фактическоеF табличноеОбщее2131,1844---Влияние фактора А190,15447,540,922,69Влияние фактора В220,362110,182,133,32Влияние факторов А и В167,16820,900,402,27Случайные отклонения1553,513051,78--

Вывод: на количество служебных частей речи в этих текстах таже не влияет объем отрывка; не доказана зависимость между авторским стилем (И. Альенде, К. Тильман и Ф.С. Фицджеральда) и количеством служебных частей речи; оба фактора не оказывают совместного влияния на содержание служебных частей речи в данных текстах.

Заключение


В ходе проведенного анализа отрывков из трех текстов на зависимость частоты появления частей речи от объема текстового отрывка и при переходе от одного автора к другому.

В курсовом проекте представлен двухфакторный дисперсный анализ таких частей речи, как существительные, глаголы, прилагательные и служебные. Для каждого из них рассчитанное значение коэффициента F было меньше табличного критерия Фишера, поэтому можно сделать вывод о том, что гипотеза влияния размера текста в символах на его морфологический состав не подтвердилась. Однако по аналогичной схеме было доказано, что количество существительных и глаголов в тексте зависит от авторского стиля (для конкретной выборки авторов). В случае с прилагательными и служебными частями речи такое влияние не обнаружено. Также количество всех рассматриваемых частей речи не зависит от взаимодействия факторов "объем" и "авторский стиль".