synthtool/gcp/snippets.py

*55e87721SMatt Gilbride# Copyright 2020 Google LLC
*55e87721SMatt Gilbride#
*55e87721SMatt Gilbride# Licensed under the Apache License, Version 2.0 (the "License");
*55e87721SMatt Gilbride# you may not use this file except in compliance with the License.
*55e87721SMatt Gilbride# You may obtain a copy of the License at
*55e87721SMatt Gilbride#
*55e87721SMatt Gilbride#     https://www.apache.org/licenses/LICENSE-2.0
*55e87721SMatt Gilbride#
*55e87721SMatt Gilbride# Unless required by applicable law or agreed to in writing, software
*55e87721SMatt Gilbride# distributed under the License is distributed on an "AS IS" BASIS,
*55e87721SMatt Gilbride# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
*55e87721SMatt Gilbride# See the License for the specific language governing permissions and
*55e87721SMatt Gilbride# limitations under the License.
*55e87721SMatt Gilbride
*55e87721SMatt Gilbrideimport glob
*55e87721SMatt Gilbrideimport os
*55e87721SMatt Gilbrideimport re
*55e87721SMatt Gilbridefrom typing import Dict, List
*55e87721SMatt Gilbride
*55e87721SMatt GilbrideOPEN_SNIPPET_REGEX = r".*\[START ([a-z0-9_]+)\].*$"
*55e87721SMatt GilbrideCLOSE_SNIPPET_REGEX = r".*\[END ([a-z0-9_]+)\].*$"
*55e87721SMatt GilbrideOPEN_EXCLUDE_REGEX = r".*\[START_EXCLUDE\].*$"
*55e87721SMatt GilbrideCLOSE_EXCLUDE_REGEX = r".*\[END_EXCLUDE\].*$"
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride
*55e87721SMatt Gilbridedef _trim_leading_whitespace(lines: List[str]) -> List[str]:
*55e87721SMatt Gilbride    """Trims leading, plain spaces from the snippet content. Finds the minimum
*55e87721SMatt Gilbride    number of leading spaces, ignoring empty lines, and removes that number of
*55e87721SMatt Gilbride    spaces from each line.
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    Args:
*55e87721SMatt Gilbride        lines (List[str]): Lines of content. These lines are newline terminated.
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    Returns:
*55e87721SMatt Gilbride        List of trimmed lines.
*55e87721SMatt Gilbride    """
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    def number_of_leading_spaces(input: str) -> int:
*55e87721SMatt Gilbride        return len(input) - len(input.lstrip(" "))
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    def is_empty_line(input: str) -> bool:
*55e87721SMatt Gilbride        if re.match(r"^\s*$", input):
*55e87721SMatt Gilbride            return True
*55e87721SMatt Gilbride        return False
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    leading_spaces = [
*55e87721SMatt Gilbride        number_of_leading_spaces(line) for line in lines if not is_empty_line(line)
*55e87721SMatt Gilbride    ]
*55e87721SMatt Gilbride    max_leading_spaces = min(leading_spaces)
*55e87721SMatt Gilbride    return [
*55e87721SMatt Gilbride        "\n" if is_empty_line(line) else line[max_leading_spaces:] for line in lines
*55e87721SMatt Gilbride    ]
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride
*55e87721SMatt Gilbridedef all_snippets_from_file(sample_file: str) -> Dict[str, str]:
*55e87721SMatt Gilbride    """Reads in a sample file and parse out all contained snippets.
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    Args:
*55e87721SMatt Gilbride        sample_file (str): Sample file to parse.
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    Returns:
*55e87721SMatt Gilbride        Dictionary of snippet name to snippet code.
*55e87721SMatt Gilbride    """
*55e87721SMatt Gilbride    if not os.path.exists(sample_file):
*55e87721SMatt Gilbride        return {}
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    snippet_lines = {}  # type: Dict[str, List[str]]
*55e87721SMatt Gilbride    open_snippets = set()
*55e87721SMatt Gilbride    with open(sample_file) as f:
*55e87721SMatt Gilbride        excluding = False
*55e87721SMatt Gilbride        # Iterate over each line:
*55e87721SMatt Gilbride        # - If the line matches an opening snippet tag, add that snippet tag to
*55e87721SMatt Gilbride        #   the set of open tags.
*55e87721SMatt Gilbride        # - If the line matches a closing snippet tag, remove that snippet tag
*55e87721SMatt Gilbride        #   from the set of open tags.
*55e87721SMatt Gilbride        # - If the line matches an opening exclude tag, record that we excluding
*55e87721SMatt Gilbride        #   content.
*55e87721SMatt Gilbride        # - If the line matches a closing exclude tag, record that we are capturing
*55e87721SMatt Gilbride        #   content again.
*55e87721SMatt Gilbride        # - Otherwise, if we are not excluding content, add the line to each of the
*55e87721SMatt Gilbride        #   open snippets
*55e87721SMatt Gilbride        #
*55e87721SMatt Gilbride        # This allows us to handle parsing nested or interleaved snippets and ignore
*55e87721SMatt Gilbride        # blocks of code in the snippets
*55e87721SMatt Gilbride        for line in f:
*55e87721SMatt Gilbride            open_match = re.match(pattern=OPEN_SNIPPET_REGEX, string=line)
*55e87721SMatt Gilbride            close_match = re.match(pattern=CLOSE_SNIPPET_REGEX, string=line)
*55e87721SMatt Gilbride            open_exclude_match = re.match(pattern=OPEN_EXCLUDE_REGEX, string=line)
*55e87721SMatt Gilbride            close_exclude_match = re.match(pattern=CLOSE_EXCLUDE_REGEX, string=line)
*55e87721SMatt Gilbride            if open_match and not excluding:
*55e87721SMatt Gilbride                open_snippets.add(open_match[1])
*55e87721SMatt Gilbride                if not open_match[1] in snippet_lines:
*55e87721SMatt Gilbride                    snippet_lines[open_match[1]] = []
*55e87721SMatt Gilbride            elif close_match and not excluding:
*55e87721SMatt Gilbride                open_snippets.discard(close_match[1])
*55e87721SMatt Gilbride            elif open_exclude_match:
*55e87721SMatt Gilbride                excluding = True
*55e87721SMatt Gilbride            elif close_exclude_match:
*55e87721SMatt Gilbride                excluding = False
*55e87721SMatt Gilbride            elif not excluding:
*55e87721SMatt Gilbride                for snippet in open_snippets:
*55e87721SMatt Gilbride                    snippet_lines[snippet].append(line)
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    return {
*55e87721SMatt Gilbride        snippet: "".join(_trim_leading_whitespace(lines))
*55e87721SMatt Gilbride        for snippet, lines in snippet_lines.items()
*55e87721SMatt Gilbride    }
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride
*55e87721SMatt Gilbridedef all_snippets(snippet_globs: List[str]) -> Dict[str, str]:
*55e87721SMatt Gilbride    """Walks the samples directory and parses snippets from each file.
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    Args:
*55e87721SMatt Gilbride        snippet_globs (List[str]): List of path globs to expand.
*55e87721SMatt Gilbride
*55e87721SMatt Gilbride    Returns:
*55e87721SMatt Gilbride        Dictionary of snippet name to snippet code.
*55e87721SMatt Gilbride    """
*55e87721SMatt Gilbride    snippets = {}
*55e87721SMatt Gilbride    for snippet_glob in snippet_globs:
*55e87721SMatt Gilbride        for file in glob.glob(snippet_glob, recursive=True):
*55e87721SMatt Gilbride            for snippet, code in all_snippets_from_file(file).items():
*55e87721SMatt Gilbride                snippets[snippet] = code
*55e87721SMatt Gilbride    return snippets