Themen für Bachelor/Masterarbeiten im Bereich Optimierung Institut

Transcription

Themen für Bachelor/Masterarbeiten im Bereich Optimierung Institut
Themen für Bachelor/Masterarbeiten im Bereich Optimierung
Institut für Optimierung und Diskrete Mathematik
Bettina Klinz
Stand 2012 — Update für 2013 in Arbeit
Im Anschluss werden mögliche Themen für Bachelorthemen vorgeschlagen. Einige davon sind auch
für Masterarbeiten geeignet. Weitere Themen sind auf Anfrage verfügbar.
1
Earliest arrival flows
In klassischen Netzwerkflußmodellen wird die Zeit, die für die Flußverschickung über Kanten benötigt
wird, nicht berücksichtigt. Das Konzept von dynamischen Flüssen (dynamic flows, flows over time)
nimmt sich dieser Schwachstelle an. Für jede Kante (i, j) wird neben den aus dem klassischen Modell
bekannten Kapazitäten uij die Durchflusszeit (transit time) τij angegeben, die bestimmt wielange der
Fluss von i nach j benötigt. Ferner ist ein Zeithorizont T gegeben. Ein maximaler dynamischer Fluss
ist ein dynamischer Fluss, der innerhalb des Zeithorizonts die maximal mögliche Flussmenge versendet.
Ein earliest arrival flow (EAF) maximiert die verschickte Flussmenge nicht nur zur Zeit T , sondern
auch zur Zeit T − 1, T − 2 etc.
EAFs finden Anwendungen z.B. in Evakuierungsproblemen. Bereits seit den 1960-ern weiss man,
dass für den Fall einer Quelle und einer Senke stets ein EAF existiert und dass sich ein solcher in
pseudopolynomialer Zeit berechnen läßt (siehe Gale [12] bzw. Minieka [28]). Hoppe und Tardos [22]
gaben ein FPTAS für diesen Spezialfall an, der auf einer Skalierungsidee beruht. Für serielle parallele
Graphen kann ein EAF in polynomialer Zeit gefunden werden [33].
Der Mehrquellen bzw. Mehrsenken-Fall ist komplizierter. Hier ist i.a. nicht einmal die Existenz eines
EAF gesichert.
Im Fall mehrerer Quellen und einer Senke gilt weiterhin, dass stets ein EAF existiert, die Bestimmung
eines solchen ist aber aufwendiger als im Fall einer Quelle und einer Senke. Hajek und Ogier [19]
entwickelten den ersten polynomiellen Algorithmus für den Spezialfall mit τij = 0 für alle Kanten
(i, j). Fleischers Algorithmus [9] löst dieselbe Aufgabe effizienter. Fleischer und Skutella [11] schlugen
ein FPTAS vor.
Im Fall einer Quelle und mehrerer Senken ist die Existenz eines EAF nicht gesichert. Schon für
eine Quelle und zwei Senken sind einfache Beispiele bekannt, für die kein EAF existiert (siehe [9,
5]. Selbst im Spezialfall, dass τij = 0 für alle Kanten (i, j) gilt, ist die Existenz eines EAF nicht
garantiert. Skutella und Schmidtschmidt gelingt es jedoch für diesen Spezialfall die Netzwerke zu
charakterakterisieren für die unabhängig von der konkreten Instanz stets ein EAF existiert.
Während sich die bisher genannten Arbeiten mit dem Fall beschäftigen, in dem die Kapazitäten
und Durchflusszeiten konstant sind, ist im Fall von Evakuierungsproblemen der Fall zeitabhängiger
Kantendaten besonders interessant. EAFs mit zeitabhänigen Daten wurden u.a. von Tjandra und
Hamacher [37, 20] und Baumann und Köhler [4] untersucht.
Ziel der Arbeit: Es soll ein Überblick zum Thema EAF gegeben werden. Ferner sollen für ein spezielles
EAF-Problem (Wahl nach Absprache) ein Algorithmus implementiert werden und an einigen Testbeispielen getestet werden. Je nach individuellen Interessen kann das Thema eher theorielastig oder
praktischer (mehr Gewicht auf Anwendungen in Evakuierungsproblemen) ausgelegt werden.
1
2
Sports elimination problems
Ein klassisches Problem, das bereits in den 1960-er Jahren erstmals untersucht wurde, ist, ob ein
Baseball-Team zu einem bestimmten Zeitpunkt der Meisterschaft noch Meister werden kann oder
nicht. Etwas spezifischer: Gegeben sind n Baseballteams einer Liga. Zu einem konkreten Zeitpunkt
der Meisterschaft habe Team i wi Siege erworben und es verbleiben gij zu absolvierende Partien
zwischen Teams i und j. Ein Team wird eliminiert genanntm wenn es es nicht möglich ist, daß dieses
Team am Ende der Meisterschaft Platz 1 einnimmt (evtl. zusammen mit punktegleichen Teams).
Schwartz [35] führte die Fragestellung, ob ein einzelnes Team eliminiert ist, auf ein maximales Flussproblem zurück. Hoffman und Rivlin [21] verallgemeinerten dieses Ergebnis und charakterisierten, wann
ein Team nicht mehr Platz q erreichen kann.
Gusfield und Martel[16] und McCormick [27] bestimmten die sogenannte Eliminationszahl, das ist die
minimale Anzahl verbliebener Partien, die ein Team gewinnen muss, um eine Chance auf Platz 1 zu
haben. Die Methoden greifen auf Ergebnisse zu parametrischen maximalen Flussproblemen zurück [13].
Ferner zeigte McCormick, dass es NP-vollständig ist zu entscheiden, ob ein Team noch mindestens
Platz q erreichen kann.
Wayne [46] zeigte, daß es eine Schwellwertpunktzahl W ∗ gibt, sodass gilt, daß Team i genau dann
eliminiert ist, wenn wi + gi < W ∗ wobei gi die Anzahl der Spiele bezeichnet, die Team i noch zu
absolvieren hat. Basierend auf dieser Charakterisierung lassen sich alle eliminierten Teams mithilfe
eines einzigen maximalen Flussproblems bestimmen. Ein analoges Strukturresultat zeigten unabhängig
davon Adler et al. [1] unter Verwendung von linearen Programmierungsmethoden.
Gusfield und Martel verallgemeinern die Charakterisierungen aus [46] und [1]. Es werden allgemeinere
Schwellwertresultate erzielt, u.a. auch für den Fall von Fussball. Die Ergebnisse werden auf nicht algorithmischem Wehe hergeleitet. Die Arbeit enthält auch neue Komplexitätsergebnisse zu verwandten
Fragestellungen.
Bernhold et al. [6] untersuchen das Eliminationsproblem für Fussball für die Situation in der der Sieger
3 Punkte erhält und zeigen, dass das Problem NP-vollständig ist.
Kern und Paulusma [24] untersuchen die Komplexität einer allgemeineren Problemstellung von Bewerbsformen, bei denen es mehr als 3 mögliche Ausgänge einer Partie gibt.
Russell [32] behandelt im ersten Teil seiner Dissertation den komplexeren Fall von Eliminationsproblemen in der NHL (nordamerikanische Eishockey-Liga).
Ziel der Arbeit ist es einen Überblick über (einen Teil) der betrachteten Fragestellungen und erzielten
Ergebnisse zu geben. Je nachdem ob die Arbeit eher theoretisch oder eher praktisch ausgerichtet wird,
soll für ein ausgewähltes Teilproblem ein effizienter Algorithmus implementiert und getestet werden.
Details können individuell je nach persönlichen Präferenzen abgesprochen werden.
3
Bestimmer spezieller (partieller) lateinischer Quadrate
Ein lateinisches Quadrat der Ordnung n ist eine n × n Matrix, die in jeder Zeile und in jeder Spalte
jede Zahl von 1 bis n genau einmal enthält.
Sei ein lateinisches Quadrat L der Ordnung n gegeben. di (k, l) bezeichne den Absolutbetrag der
Differenz der Indices der Spalten, die die Einträge k bzw. l in Zeile i enthalten. Die durchschnittliche
Distanz zweier Zahlen aus der Menge {1, . . . , n} in L ist gegeben durch
d(k, l) =
n
1X
di (k, l).
n i=1
Ein lateinisches Quadrat wird totally spatially balanced genannt, wenn d(k, l) =
k < l ≤ n gilt.
2
n(n+1)
3
für alle 1 ≤
Das Problem solche lateinisches Quadrate zu finden, wird hier in der Folge als TBLS Problem bezeichnet.
Das TBLS Problem spielt eine Rolle im Design von experimentellen Untersuchungen z.B. in der Landwirtschaft, siehe [41, 42] und http://www.cs.cornell.edu/gomes/SBLS.htm.
Es ist kein polynomieller Algorithmus zur Konstruktion von lateinischen Quadraten, die totally spatially balanced sind, bekannt und auch das Problem zu charakterisieren, wann solche existieren ist
offen. (Es ist einfach einzusehen, dass n nicht kongruent 1 modulo 3 sein darf.)
In der Literatur sind Ansätze beschrieben, die versuchen das TBLS Problem mit Methoden aus dem
Bereich der kombinatorischen Optimierung (lokale Suchmethoden und Metaheuristiken) und aus dem
Bereich constraint programming anzugehen.
Gomes et al. [14] beschreiben einen Ansatz mit simulated annealing. Der Ansatz ähnelt einem Ansatz
für das Travelling Tournament Problem.
Weitere Ansätze und Verfeinerungen, u.a. in bezug auf die verwendeten Nachbarschaften finden sich
in den Arbeiten von van Hentenryck et al. [43] and Smith et al. [36].
Ziel der Arbeit ist es die bekannten Ergebnisse zum TBLS Problem zusammenzustellen sowie einen
Ansatz zur Generierung von lateinischen Quadraten, die totally spatially balanced sind, zu implementieren und damit zu experimentieren.
Im Umfeld von lateinischen Quadraten gibt es ferner weitere Themen für Bachelor- und Masterarbeiten, die auf Anfrage näher beschrieben werden können. Lateinische Quadrate und unvollständige
lateinische Quadrate spielen u.a. einen Rolle in planaren 3-dimensionalen Zuordnungsproblemen, das
zu meinen aktuellen Forschungsinteressen gehört.
4
The travelling tournament problem
Das Travelling Tournament Problem ist ein Zeitplan-Erstellungsproblem, das im Bereich des Sports
auftritt und von der Problematik, die bei der Erstellung des Spielplans in der MLB (Major League
Baseball) in Nordamerika auftritt. In dieser Liga spielen 30 Teams 162 Spiele, die über einen Zeitraum
von 180 Tagen von Anfang April bis Ende September verteilt sind. Im realen Problem sind Hunderte von Rand- und Nebenbedingungen zu berücksichtigen. Die wichtigsten zu berücksichtigenden
Aspekte ergeben sich aber aus der Reiseproblematik für die Teams und dem Muster von Heim- und
Auswärtsspielen.
Auf der einen Seite möchten die Teams ihre Gesamtreisedistanz klein halten, aber auf der anderen
Seite möchte kein Team zu lange vom Heimatort abwesend sein oder zu lange nur am Heimatort Spiele
abhalten.
Ähnliche Problemstellungen treten auch in anderen Sportarten auf.
Das Travelling tournament Problem TTP stellt den Versuch dar, Problemstellungen der obigen Art
zu abstrahieren, und läßt sich wie folgt beschreiben ([7]):
Wir betrachten n Teams (n sei gerade) und ein Turnier in dem jedes Team zweimal gegen jedes andere
Team spielt, einmal auswärts und einmal zuhause. Es werden genai 2(n−1) Zeitslots für alle Partien eines solchen Turniers benötigt. Die Distanzen zwischen den Heimatstadien der Teams seien in der n × n
Matrix D dargestellt. Jedes Team startet an seinem Heimatort, reist zu den Spielen, und reist am Ende
(falls nötig) wieder nach Hause. Aufeinanderfolgende Auswärtsspiele definieren eine Auswärtspielkomplex (Spielreise, road trip). Aufeinanderfolgende Heimspiele definieren einen Heimspielkomplex (home
stand). Die Länge eines solchen Komplexes ist die Anzahl der Spielgegner.
Ziel im TTP ist es für gegebenes n, D und zwei Distanzschranken L und U einen Spielplan der oben
beschriebenen Art zu finden sodass alle Auswärts- und Heimkomplexe eine Länge zwischen L und U
aufweisen und sodass die Gesamtreisedistanz der Teams minimiert wird.
3
Die Parameter L und U sorgen für einen Trade-off zwischen Reisedistanz und Aspekten, die das HeimAuswärtsmuster betreffen. Für L = 1 und U = n − 1, liegt die größte Freiheit vor. Die Minimierung
der Reisedistanz und damit der TSP-Aspekt, steht im Vordergrund. Für kleine Werte von U muss ein
Team oft heimreisen und die Gesamtreisedistanz wird dadurch i.a. ansteigen.
Thielen und Westphal [39] zeigten, dass das TTP für U = 3 NP-schwer ist.
Das TTP stellt sich in der Praxis als sehr viel unangenehmer als das TSP heraus. Selbst recht kleine
Instanzen stellen einen echten Challenge dar. Die besten oberen Schranken wurden mit Metaheuristiken
erzielt, siehe [40, 44, 2].
Die Arbeiten [8, 31] beschäftigen sich mit exakten Ansätzen für das TTP.
In den letzten Jahren rückte zunehmend auch der Approximationsaspekt in das Zentrum des Interes9
- Approximationsalgorithmus für den metrischen
ses. Miyashiro et al. [29] entwarfen einen 2 + 4(n−1)
Spezialfall des TTP mit U = 3. In Yamaguchi et al. [48] werden die Ergebnisse aus der Vorarbeit
verbessert und erweitert. Für den Fall U = 3 resultiert eine 5/3 + 1/n-Approximation. Thielen und
Westphal [38] behandeln den Fall U = 2. Westphal und Noparlik [47] untersuchen den Fall U ≥ 3.
Bhattacharyya [3] zeigte, dass das TTP mit U = n − 1 NP-schwer ist. Imahori et al. [23] präsentieren
einen 2.75-Approximationsalgorithmus für den metrischen Spezialfall.
Ziel der Arbeit ist es sich mit dem TTP auseinanderzusetzen. Ob der Schwerpunkt mehr auf die
heuristisch-praktische Seite oder die theoretische Seite gelegt wird, ist abhängig von der Interessenslage
des Bearbeiters des Themas. Diese Themenstellung eignet sich zur Behandlung mit Metaheuristiken
(simulated annealing, Tabu Suche etc.)
5
Combinatorial optimization problems in computational biology
Im Gebiet, das sich computational biology nennt tritt eine Vielfalt von kombinatorischen Optimierungsproblemen auf. Eine grobe Übersicht liefern z.B. die Bücher von Waterman [45] und Gusfieldgusfield.
Je nach Interessenslage des Bearbeiters lassen sich in diesem Bereich unterschiedliche Themenstellungen für Bachelor- und Masterarbeiten angeben.
Als Beispiel sei die Arbeit von Gusfield et al. [18] genannt, die auf einen Spezialfall des TSP führt.
Ideen könnte auch ein Blick auf die Webseite von Ron Shamir http://www.cs.tau.ac.il/ rshamir/
sowie die Webseite von Dan Gusfield http://www.cs.ucdavis.edu/ gusfield/ liefern.
Literatur
[1] I. Adler, A. L. Erera, D. S. Hochbaum, E. V. Olinick, Baseball, optimization, and the world wide
web, Interfaces 32, 2002, 12-22.
[2] A. Anagnostopoulos, L. Michel, P. van Hentenryck, Y. Vergados, A simulated annealing approach
to the traveling tournament problem, Journal of Scheduling 9, 2006, 177-193.
[3] R. Bhattacharyya, A note on complexity of traveling tournament problem, available from Optimization Online, 2009, http://www.optimization-online.org/.
[4] N. Baumann, E. Köhler, Approximating earliest arrival flows with flow-dependent transit times,
Discrete Applied Mathematics 155, 2007, 161-171.
[5] N. Baumann, M. Skutella, Solving evacuation problems efficiently: Earliest arrival flows with
multiple sources, Mathematics of Operations Research 34, 2009, 499-512.
4
[6] T. Bernholt, A. Gülich, T. Hofmeister, N. Schmitt, Football elimination is hard to decide under the
3-point-rule, in: Mathematical Foundations of Computer Science 1999, Lecture Notes in Computer
Science, Vol. 1672, Springer, Berlin, 1999, pp. 410-418.
[7] K. Easton, G. Nemhauser, M. Trick, The Travelling Tournament Problem: Description and Benchmarks, in Principle and Practises of Constraint Programming - CP 2001, Springer Lecture Notes
in Computer Science 2239, 2001, 580–585.
[8] K. Easton, G. Nemhauser, M. Trick, Solving the Traveling Tournament Problem: A Combined
Integer Programming and Constraint Programming Approach, E. Burke and P. Causmaeher
(eds.), Springer Lecture Notes in Computer Science 2740, 2004, 63–77.
[9] L.K. Fleischer, Faster algorithms for the quickest transshipment problem, SIAM Journal on Optimization 12, 2001, 18-35.
[10] L.K. Fleischer, E. Tardos, Efficient continuous-time dynamic network flow algorithms, Operations
Research Letters 23, 1998, 71-80.
[11] L.K. Fleischer, M. Skutella, Quickest flows over time, SIAM Journal on Computing 36, 2007,
1600-1630.
[12] D. Gale, Transient flows in networks, Michigan Mathematical Journal 6, 1959, 59-63.
[13] G. Gallo, M. D. Grigoriadis, R. E. Tarjan, A fast parametric maximum flow algorithm and
applications, SIAM Journal on Computing 18, 1989, 30–55.
[14] C. Gomes, M. Sellmann, C. van Es, H van Es, The challenge of generating spatially balanced
Scientific experiment designs, in: Proc. of Conf. on Integration of AI and OR Techniques in
Constraint Programming for Combinatorial Optimization Problems (CP-AI-OR ’04), 2004.
[15] D. Gusfield, Algorithms on Strings, Trees and Sequences, Cambridge University Press, 1997.
[16] D. Gusfield, C. Martel, A fast algorithm for the generalized parametric minimum cut problem
and applications, Algorithmica 7, 1992, 499–519.
[17] D. Gusfield, C. Martel, The structure and complexity of sports elimination numbers Algorithmica,
32, 2002, 73–86.
[18] D. Gusfield, R. Karp, L. Wang, P. Stelling, Graph traversals, genes and matroids: an efficient
case of the travelling salesman problem, Discrete Applied Mathematics 88, 1998, 167–180.
[19] B. Hajek, R. G. Ogier, Optimal dynamic routing in communication networks with continuous
traffic, Networks 14, 4574-87.
[20] H.W. Hamacher, S.A. Tjandra, Earliest arrival flow model with time dependent capacity for
solving evacuation problems. Pedestrian and Evacuation Dynamics, 2002, 267-276.
[21] A. Hoffman, T. Rivlin, When is a team “mathematically” eliminated? In: Princeton Symposium
on Mathematical Programming (1967), 1970, pp. 391–401, 1970.
[22] B. Hoppe, ´. Tardos, Polynomial time algorithms for some evacuation problems, in: Proceedings
of the Fifth Annual ACM-SIAM Symposium on Discrete Algorithms (SODA), ACM, 1994.
[23] S. Imahori, T. Matsui, R. Miyashiro, A 2.75-approximation algorithm for the unconstrained
traveling tournament problem, arXiv:1110.0620v1, October 2011.
[24] W. Kern, D. Paulusma, The computational complexity of the elimination problem in generalized
sports competitions, Discrete Optimization, 1, 2004, 205–214.
5
[25] H. Konno und H. Yamazaki, Mean-absolute deviation portfolio optimization model and its applications tu Tokyo stock market, Management Science 37(5), 519-531, 1991.
[26] Peter Korteweg, Postman problems, priorities and the concept of serving, Master Thesis, Unversity of Amsterdam, 2002.
[27] S. T. McCormick, Fast algorithms for parametric scheduling come from extensions to parametric
maximum flow.
[28] E. Minieka, Maximal, lexicographic, and dynamic network flows, Operations Research 21, 1973,
517-527.
[29] R. Miyashiro, T. Matsui and S. Imahori, An approximation algorithm for the traveling tournament
problem, Annals of Operations Research 194, 2008, 317–324.
[30] M. Monaci und U. Pferschy, On the robust knapsack problem, verfügbar via Optimization Online
2011-04-3019, 2011.
[31] C.C. Ribeiro, S. Urrutia, OR on the ball: applications in sports scheduling and management,
OR/MS Today 31, 2004, 50-54.
[32] T.C. Russell, A Computational Study of Problems in Sports, Ph.D. thesis, University of Waterloo,
2010.
[33] S. Ruzika, H. Sperber, M. Steiner, Earliest arrival flows on series-parallel graphs Networks 57,
2011, 169-173.
[34] M. Schmidt, M. Skutella, Earliest arrival flows in networks with multiple sinks, Discrete Applied
Mathematics, 2011.
[35] B. Schwartz, Possible winners in partially completed tournaments, SIAM Review 8, 1966, 302–
308.
[36] C. Smith, C.P. Gomes, C.Fernndez, Streamlining local search for spatially balanced Latin squares,
In: Proceedings of the IJCAI’05, 2005, pp. 1539-1540.
[37] S. Tjandra, Dynamic network optimization with application to the evacuation problem, Ph.D.
thesis, Universität Kaiserslautern, Shaker Verlag, Aachen, Germany.
[38] C. Thielen, S. Westphal, Approximating the traveling tournament problem with maximum tour
length 2, Lecture Notes in Computer Science 6507, 2010, 303-314.
[39] C. Thielen, S. Westphal, Complexity of the Traveling Tournament Problem, Theoretical Computer
Science, 412, 2011, 345–351.
[40] M.
Trick,
Challenge
travelling
http://mat.gsia.cmu.edu/TOURN/.
tournament
problems,
Webseite
zum
TTP
[41] H. van Es, C. van Es, The spatial nature of randomization and its effects on outcome of field
experiments, Agronomy Journal 85, 1993, 420–428.
[42] H. van Es, C. Gomes, M. Sellmann, C. van Es, Spatially-balanced complete block designs for field
experiments Geoderma Journal, 140, 2007 346–352.
[43] P. van Hentenryck, L. Michel, Differentiable invariants, available
http://www.cs.brown.edu/people/pvh/pvhHome/Pub 2006.html, 2006.
6
online
at
[44] P. van Hentenryck, Y. Vergados, Traveling tournament scheduling: a systematic evaluation of
simulated annealing, Lecture Notes in Computer Science 3990, 2006, 228-243.
[45] M.S. Waterman, Introduction to Computational Biology: maps, sequences and genomes, Chapman
and Hall, 1995.
[46] K. Wayne, A new property and faster algorithm for baseball elimination. SIAM Journal on
Discrete Mathematics, 14, 2001, 223–229.
[47] S. Westphal, K. Noparlik, A 5.875-approximation for the traveling tournament problem, In: Proceedings of the 8th International Conference on the Practice and Theory of Automated Timetabling (PATAT),
[48] D. Yamaguchi, S. Imahori, R. Miyashiro, T. Matsui, An improved approximation algorithm for
the traveling tournament problem, Lecture Notes in Computer Science 5878, 2009, 679–688.
7