7.4. Другие применения рекурсии


    • Топологическая сортировка. Представим себе n чиновников, каждый из которых выдает справки определенного вида. Мы хотим получить все эти справки, соблюдая установленные ограничения: у каждого чиновника есть список справок, которые нужно собрать перед обращением к нему. Дело безнадёжно, если схема зависимостей имеет цикл (справку A нельзя получить без B, B без C,..., Y без Z и Z без A). Предполагая, что такого цикла нет, требуется составить план, указывающий один из возможных порядков получения справок.

      Изображая чиновников точками, а зависимости - стрелками, приходим к такой формулировке. Имеется n точек, пронумерованных от 1 до n. Из каждой точки ведет несколько (возможно, 0) стрелок в другие точки. (Такая картинка называется ориентированным графом.) Циклов нет. Требуется расположить вершины графа (точки) в таком порядке, чтобы конец любой стрелки предшествовал ее началу. Эта задача называется топологической сортировкой.

      7.4.1. Доказать, что это всегда возможно.

      Решение. Из условия отсутствия циклов вытекает, что есть вершина, из которой вообще не выходит стрелок (иначе можно двигаться по стрелкам, пока не зациклимся). Ее будем считать первой. Выкидывая все стрелки, в нее ведущие, мы сводим задачу к графу с меньшим числом вершин и продолжаем рассуждение по индукции.

      7.4.2. Предположим, что ориентированный граф без циклов хранится в такой форме: для каждого i от 1 до n в num[i] хранится число выходящих из i стрелок, в adr[i][1],..., adr[i][num[i]] - номера вершин, куда эти стрелки ведут. Составить (рекурсивный) алгоритм, который производит топологическую сортировку не более чем за C*(n+m) действий, где m - число ребер графа (стрелок).

      Замечание. Непосредственная реализация приведенного выше доказательства существования не дает требуемой оценки; ее приходится немного подправить.

      Решение. Наша программа будет печатать номера вершин. В массиве printed: array[1..n] of boolean мы будем хранить сведения о том, какие вершины напечатаны (и корректировать их одновременно с печатью вершины). Будем говорить, что напечатанная последовательность вершин корректна, если никакая вершина не напечатана дважды и для любого номера i, входящего в эту последовательность, все вершины, в которые ведут стрелки из i, напечатаны, и притом до i.
      procedure add (i: 1..n);
      | {дано: напечатанное корректно;}
      | {надо: напечатанное корректно и включает вершину i}
      begin
      | if printed [i] then begin {вершина i уже напечатана}
      | | {ничего делать не надо}
      | end else begin
      | | {напечатанное корректно}
      | | for j:=1 to num[i] do begin
      | | | add(adr[i][j]);
      | | end;
      | | {напечатанное корректно, все вершины, в которые из
      | | i ведут стрелки, уже напечатаны - так что можно
      | | печатать i, не нарушая корректности}
      | | if not printed[i] then begin
      | | | writeln(i); printed [i]:= TRUE;
      | | end;
      | end;
      end;

      Основная программа:
      for i:=1 to n do begin
      | printed[i]:= FALSE;
      end;
      for i:=1 to n do begin
      | add(i)
      end;

      К оценке времени работы мы вскоре вернёмся.

      7.4.3. В приведенной программе можно выбросить проверку, заменив
      if not printed[i] then begin
      | writeln(i); printed [i]:= TRUE;
      end;

      на
      writeln(i); printed [i]:= TRUE;
      Почему? Как изменится спецификация процедуры?

      Решение. Спецификацию можно выбрать такой:
      дано: напечатанное корректно
      надо: напечатанное корректно и включает вершину i;
      все вновь напечатанные вершины доступны из i.

      7.4.4. Где использован тот факт, что граф не имеет циклов?

      Решение. Мы опустили доказательство конечности глубины рекурсии. Для каждой вершины рассмотрим ее "глубину" - максимальную длину пути по стрелкам, из нее выходящего. Условие отсутствия циклов гарантирует, что эта величина конечна. Из вершины нулевой глубины стрелок не выходит. Глубина конца стрелки по крайней мере на 1 меньше, чем глубина начала. При работе процедуры add(i) все рекурсивные вызовы add(j) относятся к вершинам меньшей глубины.

      Вернёмся к оценке времени работы. Сколько вызовов add(i) возможно для какого-то фиксированного i? Прежде всего ясно, что первый из них напечатает i, остальные сведутся к проверке того, что i уже напечатано. Ясно также, что вызовы add(i) индуцируются "печатаюшими" (первыми) вызовами add(j) для тех j, из которых в i ведёт ребро. Следовательно, число вызовов add(i) равно числу входящих в i рёбер (стрелок). При этом все вызовы, кроме первого, требуют O(1) операций, а первый требует времени, пропорционального числу исходящих из i стрелок. (Не считая времени, уходящего на выполнение add(j) для концов j выходящих рёбер.) Отсюда видно, что общее время пропорционально числу рёбер (плюс число вершин).

      Связная компонента графа. Неориентированный граф - набор точек (вершин), некоторые из которых соединены линиями (ребрами). Неориентированный граф можно считать частным случаем ориентированного графа, в котором для каждой стрелки есть обратная.

      Связной компонентой вершины i называется множество всех тех вершин, в которые можно попасть из i, идя по ребрам графа. (Поскольку граф неориентированный, отношение "j принадлежит связной компоненте i" является отношением эквивалентности.)

      7.4.5. Дан неориентированный граф (для каждой вершины указано число соседей и массив номеров соседей, как в задаче о топологической сортировке). Составить алгоритм, который по заданному i печатает все вершины связной компоненты i по одному разу (и только их). Число действий не должно превосходить C*(общее число вершин и ребер в связной компоненте).

      Решение. Программа в процессе работы будет "закрашивать" некоторые вершины графа. Незакрашенной частью графа будем называть то, что останется, если выбросить все закрашенные вершины и ведущие в них ребра. Процедура add(i) закрашивает связную компоненту i в незакрашенной части графа (и не делает ничего, если вершина i уже закрашена).
      procedure add (i:1..n);
      begin
      | if вершина i закрашена then begin
      | | ничего делать не надо
      | end else begin
      | | закрасить i (напечатать и пометить как закрашенную)
      | | для всех j, соседних с i
      | | | add(j);
      | | end;
      | end;
      end;

      Докажем, что эта процедура действует правильно (в предположении, что рекурсивные вызовы работают правильно). В самом деле, ничего, кроме связной компоненты незакрашенного графа, она закрасить не может. Проверим, что вся она будет закрашена. Пусть k - вершина, доступная из вершины i по пути i-j-...-k, проходящему только по незакрашенным вершинам. Будем рассматривать только пути, не возвращающиеся снова в i. Из всех таких путей выберем путь с наименьшим j (в порядке просмотра соседей в процедуре). Тогда при рассмотрении предыдущих соседей ни одна из вершин пути j-...-k не будет закрашена (иначе j не было бы минимальным) и потому k окажется в связной компоненте незакрашенного графа к моменту вызова add(j). Что и требовалось.

      Чтобы установить конечность глубины рекурсии, заметим, что на каждом уровне рекурсии число незакрашенных вершин уменьшается хотя бы на 1.

      Оценим число действий. Каждая вершина закрашивается не более одного раза - при первым вызове add(i) с данным i. Все последующие вызовы происходят при закрашивании соседей - количество таких вызовов не больше числа соседей - и сводятся к проверке того, что вершина i уже закрашена. Первый же вызов состоит в просмотре всех соседей и рекурсивных вызовах add(j) для всех них. Таким образом, общее число действий, связанных с вершиной i, не превосходит константы, умноженной на число ее соседей. Отсюда и вытекает требуемая оценка.

      7.4.6. Решить ту же задачу для ориентированного графа (напечатать все вершины, доступные из данной по стрелкам; граф может содержать циклы).

      Ответ. Годится по существу та же программа (строку "для всех соседей" надо заменить на "для всех вершин, куда ведут стрелки").

      Быстрая сортировка Хоара. В заключение приведем рекурсивный алгоритм сортировки массива, который на практике является одним из самых быстрых. Пусть дан массив a[1]..a[n]. Рекурсивная процедура sort (l,r:integer) сортирует участок массива с индексами из полуинтервала (l,r], то есть a[l+1]..a[r], не затрагивая остального массива.
      procedure sort (l,r: integer);
      begin
      | if (l = r) then begin
      | | ничего делать не надо - участок пуст
      | end else begin
      | | выбрать случайное число s в полуинтервале (l,r]
      | | b := a[s]
      | | переставить элементы сортируемого участка так, чтобы
      | | сначала шли элементы, меньшие b - участок (l,ll]
      | | затем элементы, равные b - участок (ll,rr]
      | | затем элементы, большие b - участок (rr,r]
      | | sort (l,ll);
      | | sort (rr,r);
      | end;
      end;

      Разделение элементов сортируемого участка на три категории (меньшие, равные, большие) рассматривалось в главе о массивах (это можно сделать за время, пропорциональное длине участка). Конечность глубины рекурсии гарантируется тем, что длина сортируемого участка на каждом уровне рекурсии уменьшается хотя бы на 1.

      7.4.7. (Для знакомых с основами теории вероятностей). Доказать, что математическое ожидание числа операций при работе этого алгоритма не превосходит C*n*log n, причем константа C не зависит от сортируемого массива.

      Указание. Пусть T(n) - максимум математического ожидания числа операций для всех входов длины n. Из текста процедуры вытекает такое неравенство:
      T(n) <= Cn + 1/n [сумма по всем k+l=(n-1) чисел T(k)+T(l)]

      Первый член соответствует распределению элементов на меньшие, равные и большие. Второй член - это среднее математическое ожидание для всех вариантов случайного выбора. (Строго говоря, поскольку среди элементов могут быть равные, в правой части вместо T(k) и T(l) должны стоять максимумы T(x) по всем x, не превосходящим k или l, но это не мешает дальнейшим рассуждениям.) Далее индукцией по n нужно доказывать оценку T(n) <= C'n ln n. При этом для вычисления среднего значения x ln x по всем x=1,..,n-1 нужно интегрировать x lnx по частям как lnx * d(x*x). При достаточно большом C' член Cn в правой части перевешивается за счет интеграла x*x*d(ln x), и индуктивный шаг проходит.

      7.4.8. Имеется массив из n различных целых чисел a[1]..a[n] и число k. Требуется найти k-ое по величине число в этом массиве, сделав не более C*n действий, где C - некоторая константа, не зависящая от k и n.

      Замечание. Сортировка позволяет очевидным образом сделать это за C*n*log(n) действий. Очевидный способ: найти наименьший элемент, затем найти второй, затем третий,..., k-ый требует порядка k*n действий, то есть не годится (константа при n зависит от k).

      Указание. Изящный (хотя практически и бесполезный - константы слишком велики) способ сделать это таков:

  •    
      • А. Разобьем наш массив на n/5 групп, в каждой из которых по 5 элементов. Каждую группу упорядочим.
      • Б. Рассмотрим средние элементы всех групп и перепишем их в массив из n/5 элементов. С помощью рекурсивного вызова найдем средний по величине элемент этого массива.
      • В. Сравним этот элемент со всеми элементами исходного массива: они разделятся на большие его и меньшие его (и один равный ему). Подсчитав количество тех и других, мы узнаем, в какой из этих частей должен находится искомый (k-ый) элемент и каков он там по порядку.
      • Г. Применим рекурсивно наш алгоритм к выбранной части.
    • Пусть T(n) - максимально возможное число действий, если этот способ применять к массивам из не более чем n элементов (k может быть каким угодно). Имеем оценку:
      T(n) <= Cn + T(n/5) + T(примерно 0.7n)

      Последнее слагаемое объясняется так: при разбиении на части каждая часть содержит не менее 0.3n элементов. В самом деле, если x - средний из средних, то примерно половина всех средних меньше x. А если в пятерке средний элемент меньше x, то еще два заведомо меньше x. Тем самым по крайней мере 3/5 от половины элементов меньше x.

      Теперь по индукции можно доказать оценку T(n) <= Cn (решающую роль при этом играет то обстоятельство, что 1/5 + 0.7 < 1).

Другие записи

10.06.2016. 7.1. Примеры рекурсивных программ.
   При анализе рекурсивной программы возникает, как обычно, два вопроса: (а) почему программа заканчивает работу? (б) почему она работает правильно, если заканчивает работу?…