Add support for Literate Agda (factoring out some helper functions

from the Literate Haskell implementation)
author: Tim Baumann <tim@timbaumann.info> 2013-05-19 04:00:35 +0200
committer: Tim Baumann <tim@timbaumann.info> 2013-05-19 04:00:35 +0200
commit: bc00600db992c277770fd3651e8a49aca4b58303 (patch)
tree: 1130af516496c99b9aae5decf9dfa5258794b918
parent: f91963a6ffd4d17e338e1d4ee3b9171889fc45b0 (diff)
download: pygments-bc00600db992c277770fd3651e8a49aca4b58303.tar.gz
2 files changed, 74 insertions, 44 deletions
diff --git a/pygments/lexers/_mapping.py b/pygments/lexers/_mapping.py
index b29d8262..9fd8f713 100644
--- a/pygments/lexers/_mapping.py
+++ b/pygments/lexers/_mapping.py
@@ -162,6 +162,7 @@ LEXERS = {
     'LassoLexer': ('pygments.lexers.web', 'Lasso', ('lasso', 'lassoscript'), ('*.lasso', '*.lasso[89]'), ('text/x-lasso',)),
     'LassoXmlLexer': ('pygments.lexers.templates', 'XML+Lasso', ('xml+lasso',), (), ('application/xml+lasso',)),
     'LighttpdConfLexer': ('pygments.lexers.text', 'Lighttpd configuration file', ('lighty', 'lighttpd'), (), ('text/x-lighttpd-conf',)),
+    'LiterateAgdaLexer': ('pygments.lexers.functional', 'Literate Agda', ('lagda', 'literate-agda'), ('*.lagda',), ('text/x-literate-agda',)),
     'LiterateHaskellLexer': ('pygments.lexers.functional', 'Literate Haskell', ('lhs', 'literate-haskell'), ('*.lhs',), ('text/x-literate-haskell',)),
     'LiveScriptLexer': ('pygments.lexers.web', 'LiveScript', ('live-script', 'livescript'), ('*.ls',), ('text/livescript',)),
     'LlvmLexer': ('pygments.lexers.asm', 'LLVM', ('llvm',), ('*.ll',), ('text/x-llvm',)),
diff --git a/pygments/lexers/functional.py b/pygments/lexers/functional.py
index 32e557ca..41aac7a4 100644
--- a/pygments/lexers/functional.py
+++ b/pygments/lexers/functional.py
@@ -16,9 +16,10 @@ from pygments.token import Text, Comment, Operator, Keyword, Name, \
      String, Number, Punctuation, Literal, Generic, Error
 
 __all__ = ['RacketLexer', 'SchemeLexer', 'CommonLispLexer', 'HaskellLexer',
-           'LiterateHaskellLexer', 'SMLLexer', 'OcamlLexer', 'ErlangLexer',
-           'ErlangShellLexer', 'OpaLexer', 'CoqLexer', 'AgdaLexer',
-           'NewLispLexer', 'ElixirLexer', 'ElixirConsoleLexer', 'KokaLexer']
+           'LiterateHaskellLexer', 'AgdaLexer', 'LiterateAgdaLexer',
+           'SMLLexer', 'OcamlLexer', 'ErlangLexer', 'ErlangShellLexer',
+           'OpaLexer', 'CoqLexer', 'AgdaLexer', 'NewLispLexer', 'ElixirLexer',
+           'ElixirConsoleLexer', 'KokaLexer']
 
 
 class RacketLexer(RegexLexer):
@@ -1014,6 +1015,52 @@ class HaskellLexer(RegexLexer):
 line_re = re.compile('.*?\n')
 bird_re = re.compile(r'(>[ \t]*)(.*\n)')
 
+# bird-style
+def _bird_get_tokens_unprocessed(text, baselexer):
+    code = ''
+    insertions = []
+    for match in line_re.finditer(text):
+        line = match.group()
+        m = bird_re.match(line)
+        if m:
+            insertions.append((len(code),
+                               [(0, Comment.Special, m.group(1))]))
+            code += m.group(2)
+        else:
+            insertions.append((len(code), [(0, Text, line)]))
+    for item in do_insertions(insertions, baselexer.get_tokens_unprocessed(code)):
+        yield item
+
+
+# latex-style
+def _latex_get_tokens_unprocessed(text, baselexer, lxlexer):
+    code = ''
+    insertions = []
+
+    codelines = 0
+    latex = ''
+    for match in line_re.finditer(text):
+        line = match.group()
+        if codelines:
+            if line.lstrip().startswith('\\end{code}'):
+                codelines = 0
+                latex += line
+            else:
+                code += line
+        elif line.lstrip().startswith('\\begin{code}'):
+            codelines = 1
+            latex += line
+            insertions.append((len(code),
+                               list(lxlexer.get_tokens_unprocessed(latex))))
+            latex = ''
+        else:
+            latex += line
+    insertions.append((len(code),
+                       list(lxlexer.get_tokens_unprocessed(latex))))
+    for item in do_insertions(insertions, baselexer.get_tokens_unprocessed(code)):
+        yield item
+
+
 class LiterateHaskellLexer(Lexer):
     """
     For Literate Haskell (Bird-style or LaTeX) source.
@@ -1039,46 +1086,14 @@ class LiterateHaskellLexer(Lexer):
         if style is None:
             style = (text.lstrip()[0:1] in '%\\') and 'latex' or 'bird'
 
-        code = ''
-        insertions = []
         if style == 'bird':
-            # bird-style
-            for match in line_re.finditer(text):
-                line = match.group()
-                m = bird_re.match(line)
-                if m:
-                    insertions.append((len(code),
-                                       [(0, Comment.Special, m.group(1))]))
-                    code += m.group(2)
-                else:
-                    insertions.append((len(code), [(0, Text, line)]))
+            for item in _bird_get_tokens_unprocessed(text, hslexer):
+                yield item
         else:
-            # latex-style
             from pygments.lexers.text import TexLexer
             lxlexer = TexLexer(**self.options)
-
-            codelines = 0
-            latex = ''
-            for match in line_re.finditer(text):
-                line = match.group()
-                if codelines:
-                    if line.lstrip().startswith('\\end{code}'):
-                        codelines = 0
-                        latex += line
-                    else:
-                        code += line
-                elif line.lstrip().startswith('\\begin{code}'):
-                    codelines = 1
-                    latex += line
-                    insertions.append((len(code),
-                                       list(lxlexer.get_tokens_unprocessed(latex))))
-                    latex = ''
-                else:
-                    latex += line
-            insertions.append((len(code),
-                               list(lxlexer.get_tokens_unprocessed(latex))))
-        for item in do_insertions(insertions, hslexer.get_tokens_unprocessed(code)):
-            yield item
+            for item in _latex_get_tokens_unprocessed(text, hslexer, lxlexer):
+                yield item
 
 
 class AgdaLexer(RegexLexer):
@@ -1102,7 +1117,6 @@ class AgdaLexer(RegexLexer):
         'root': [
             # Declaration
             (r'^(\s*)([^\s\(\)\{\}]+)(\s*)(:)(\s*)', bygroups(Text, Name.Function, Text, Operator.Word, Text)),
-            (r'\s+', Text),  # Whitespace
             # Comments
             (r'--(?![!#$%&*+./<=>?@\^|_~:\\]).*?$', Comment.Single),
             (r'{-', Comment.Multiline, 'comment'),
@@ -1117,10 +1131,6 @@ class AgdaLexer(RegexLexer):
             #  Special Symbols
             (r'(\(|\)|\{|\})', Operator),
             (ur'(\.{1,3}|\||[\u039B]|[\u2200]|[\u2192]|:|=|->)', Operator.Word),
-            #(r'\\(?![:!#$%&*+.\\/<=>?@^|~-]+)', Name.Function), # lambda operator
-            #(r'(<-|::|->|=>|=)(?![:!#$%&*+.\\/<=>?@^|~-]+)', Operator.Word), # specials
-            #(r':[:!#$%&*+.\\/<=>?@^|~-]*', Keyword.Type), # Constructor operators
-            #(r'[:!#$%&*+.\\/<=>?@^|~-]+', Operator), # Other operators
             #  Numbers
             (r'\d+[eE][+-]?\d+', Number.Float),
             (r'\d+\.\d+([eE][+-]?\d+)?', Number.Float),
@@ -1130,6 +1140,7 @@ class AgdaLexer(RegexLexer):
             (r"'", String.Char, 'character'),
             (r'"', String, 'string'),
             (r'[^\s\(\)\{\}]+', Text),
+            (r'\s+?', Text),  # Whitespace
         ],
         'comment': [
             # Multiline Comments
@@ -1151,6 +1162,24 @@ class AgdaLexer(RegexLexer):
     }
 
 
+class LiterateAgdaLexer(Lexer):
+    """
+    For Literate Agda source.
+    """
+    name = 'Literate Agda'
+    aliases = ['lagda', 'literate-agda']
+    filenames = ['*.lagda']
+    mimetypes = ['text/x-literate-agda']
+
+    def get_tokens_unprocessed(self, text):
+        agdalexer = AgdaLexer(**self.options)
+
+        from pygments.lexers.text import TexLexer
+        lxlexer = TexLexer(**self.options)
+        for item in _latex_get_tokens_unprocessed(text, agdalexer, lxlexer):
+            yield item
+
+
 class SMLLexer(RegexLexer):
     """
     For the Standard ML language.
author	Tim Baumann <tim@timbaumann.info>	2013-05-19 04:00:35 +0200
committer	Tim Baumann <tim@timbaumann.info>	2013-05-19 04:00:35 +0200
commit	bc00600db992c277770fd3651e8a49aca4b58303 (patch)
tree	1130af516496c99b9aae5decf9dfa5258794b918
parent	f91963a6ffd4d17e338e1d4ee3b9171889fc45b0 (diff)
download	pygments-bc00600db992c277770fd3651e8a49aca4b58303.tar.gz