7.2. Принцип корреляции максимумовСтраница 1
Пусть исторический период от года A до года B в истории региона P описан в летописи X, разбитой на куски (главы) X(T), каждый из которых посвящён событиям одного года T. Подсчитаем объём всех кусков X(T), т. е. число страниц или строк в каждом X(T).
Полученные числа изобразим в виде графика объёмов, отложив по горизонтали годы T, а по вертикали – объёмы глав. Полученную функцию естественно назвать функцией объёма vol X(T) данной летописи X (рис. 1.2). Для другой летописи Y, описывающей те же события, график объёмов будет иметь, вообще говоря, иной вид. Здесь скажутся интересы и склонности летописцев X и Y – одно и то же событие может быть описано разным количеством слов.
Насколько существенны эти различия? Есть ли что-то общее в графиках объёмов текстов, рассказывающих об одних и тех же событиях?
Оказывается, есть. Но прежде скажем несколько слов о механизме утери информации.
Существенная характеристика всякого графика – его пики , экстремальные точки. В графике объёма они приходятся на годы, в которые кривая достигает локальных максимумов , т. е. на годы, наиболее подробно описанные в летописи на исследуемом отрезке времени. Обозначим через C(T) объём всех текстов, написанных о годе T его современниками. Это – «первоначальный фонд» информации (рис. 1.3). Его график нам точно неизвестен, поскольку тексты постепенно утрачиваются, гибнут.
Сформулируем модель потери информации.
От тех лет, которым первоначально было посвящено больше текстов, больше текстов и останется.
Другими словами, если мы фиксируем какой-то момент времени M (справа от точки B на рис. 1.3), то можем построить график C_M(T), показывающий объём текстов, которые «дожили» до момента времени M и описывают события года T.
Другими словами, C_M(T) – это остаточный, сохранившийся фонд информации от эпохи (A, B), который дошёл до года M.
Наша модель может быть переформулирована, следовательно, таким образом:
График C_M(T) должен иметь всплески примерно в те же годы на интервале (A, B), что и исходный график C(T).
Разумеется, проверить модель в таком её виде трудно, поскольку график C(T) первоначального фонда информации нам сегодня неизвестен. Но одно из следствий проверить можно.
Более поздние летописцы X и Y, описывая один и тот же период времени (A, B) и не будучи его современниками, вынуждены опираться на сохранившийся до их времени фонд информации, текстов от эпохи (A,B).
Если летописец X живёт в эпоху M, то он будет опираться на фонд C_M(T). Если летописец Y живёт в эпоху N, отличную, вообще говоря, от эпохи M, то он опирается на сохранившийся фонд C_N(T).
Естественно ожидать, что «в среднем» хронисты работают более или менее добросовестно, а потому они должны более подробно описать те годы из эпохи (A, B), от которых до них дошло больше информации, текстов.
Другими словами, график объёмов vol X(T) будет иметь всплески примерно в те годы, где имеет всплески график C_M(T). В свою очередь, график vol Y(T) будет иметь всплески примерно в те годы, где делает всплески график C_N(T).
Но точки всплесков графика C_M(T) близки к точкам всплесков исходного графика C(T). Аналогично, и точки всплесков графика C_N(T) близки к точкам всплесков графика C(T). Следовательно, графики vol X(T) и vol Y(T) должны делать всплески примерно одновременно , т. е. точки их локальных максимумов должны коррелировать (рис. 1.4).
Другое по теме
Учитель
Этот компонент не является столь универсальным
как задачник, оценка или нейронная сеть, поскольку существует ряд алгоритмов
обучения жестко привязанных к архитектуре нейронной сети. Примерами таких
алгоритмов могут служить обуч ...