Как проверить HTML-тег с помощью регулярного выражения

Опубликовано: 10 Января, 2022

Для данной строки str задача состоит в том, чтобы проверить, является ли это допустимым тегом HTML, с помощью регулярного выражения.
Действительный HTML-тег должен удовлетворять следующим условиям:

  1. Он должен начинаться с открывающего тега (<).
  2. За ним должна следовать строка в двойных или одинарных кавычках.
  3. Он не должен допускать использование одной строки в двойных кавычках, одной строки одинарных кавычек или закрывающего тега (>) без заключенных в одинарные или двойные кавычки.
  4. Он должен заканчиваться закрывающим тегом (>).

Примеры:

Input: str = “<input value = ‘>’>”; 
Output: true 
Explanation: The given string satisfies all the above mentioned conditions.
Input: str = “<br/>”; 
Output: true 
Explanation: The given string satisfies all the above mentioned conditions.
Input: str = “br/>”; 
Output: false 
Explanation: The given string doesn’t starts with an opening tag “<“. Therefore, it is not a valid HTML tag.
Input: str = “<‘br/>”; 
Output: false 
Explanation: The given string has one single quotes string that is not allowed. Therefore, it is not a valid HTML tag.
Input: str = “<input value => >”; 
Output: false 
Explanation: The given string has a closing tag (>) without single or double quotes enclosed that is not allowed. Therefore, it is not a valid HTML tag.

Подход: идея состоит в том, чтобы использовать регулярное выражение для решения этой проблемы. Следующие шаги можно выполнить, чтобы вычислить ответ.

  • Получите строку.
  • Создайте регулярное выражение для проверки допустимого тега HTML, как указано ниже:

regex = “<(“[^”]*”|"[^’]*’|[^"”>])*>”; 

  • Где:
    • < представляет собой строку, которая должна начинаться с открывающего тега (<).
    • ( представляет начало группы.
    • «[^»] * » Представляет строку, которая должна позволять заключать строку в двойные кавычки.
    • | представляет или.
    • '[^'] * 'представляет строку, которая должна позволять заключать строку в одинарные кавычки.
    • | представляет или.
    • [^ '”>] Означает, что строка не должна содержать одинарных кавычек, двойных кавычек и«> ».
    • ) представляет окончание группы.
    • * представляет 0 или более.
    • > представляет строку, которая должна заканчиваться закрывающим тегом (>).
  • Сопоставьте заданную строку с регулярным выражением. В Java это можно сделать с помощью Pattern.matcher ().
  • Вернуть true, если строка соответствует заданному регулярному выражению, иначе вернуть false.

Below is the implementation of the above approach: 
 

C++

// C++ program to validate the
// HTML tag using Regular Expression
#include <iostream>
#include <regex>
using namespace std;
 
// Function to validate the HTML tag.
bool isValidHTMLTag(string str)
{
 
  // Regex to check valid HTML tag.
  const regex pattern("<("[^"]*"|"[^"]*"|[^"">])*>");
 
  // If the HTML tag
  // is empty return false
  if (str.empty())
  {
     return false;
  }
 
  // Return true if the HTML tag
  // matched the ReGex
  if(regex_match(str, pattern))
  {
    return true;
  }
  else
  {
    return false;
  }
}
 
// Driver Code
int main()
{
   
  // Test Case 1:
  string str1 = "<input value = ">">";
  cout << isValidHTMLTag(str1) << endl;
 
  // Test Case 2:
  string str2 = "<br/>";
  cout << isValidHTMLTag(str2) << endl;
 
  // Test Case 3:
  string str3 = "br/>";
  cout << isValidHTMLTag(str3) << endl;
 
  // Test Case 4:
  string str4 = "<"br/>";
  cout << isValidHTMLTag(str4) << endl;
 
  // Test Case 5:
  string str5 = "<input value => >";
  cout << isValidHTMLTag(str5) << endl;
 
  return 0;
}
 
// This code is contributed by yuvraj_chandra

Java

// Java program to validate
// HTML tag using regex.
 
import java.util.regex.*;
 
class GFG {
 
    // Function to validate
    // HTML tag using regex.
    public static boolean
    isValidHTMLTag(String str)
    {
        // Regex to check valid HTML tag.
        String regex
            = "<("[^"]*"|"[^"]*"|[^"">])*>";
 
        // Compile the ReGex
        Pattern p = Pattern.compile(regex);
 
        // If the string is empty
        // return false
        if (str == null) {
            return false;
        }
 
        // Find match between given string
        // and regular expression
        // using Pattern.matcher()
        Matcher m = p.matcher(str);
 
        // Return if the string
        // matched the ReGex
        return m.matches();
    }
 
    // Driver Code.
    public static void main(String args[])
    {
 
        // Test Case 1:
        String str1 = "<input value = ">">";
        System.out.println(isValidHTMLTag(str1));
 
        // Test Case 2:
        String str2 = "<br/>";
        System.out.println(isValidHTMLTag(str2));
 
        // Test Case 3:
        String str3 = "br/>";
        System.out.println(isValidHTMLTag(str3));
 
        // Test Case 4:
        String str4 = "<"br/>";
        System.out.println(isValidHTMLTag(str4));
 
        // Test Case 5:
        String str5 = "<input value => >";
        System.out.println(isValidHTMLTag(str5));
    }
}

Python3

# Python3 program to validate
# HTML tag using regex.  
# using regular expression
import re
 
# Function to validate
# HTML tag using regex.
def isValidHTMLTag(str):
 
    # Regex to check valid
    # HTML tag using regex.
    regex = "<("[^"]*"|"[^"]*"|[^"">])*>"
     
    # Compile the ReGex
    p = re.compile(regex)
 
    # If the string is empty
    # return false
    if (str == None):
        return False
 
    # Return if the string
    # matched the ReGex
    if(re.search(p, str)):
        return True
    else:
        return False
 
# Driver code
 
# Test Case 1:
str1 = "<input value = ">">"
print(isValidHTMLTag(str1))
 
# Test Case 2:
str2 = "<br/>"
print(isValidHTMLTag(str2))
 
# Test Case 3:
str3 = "br/>"
print(isValidHTMLTag(str3))
 
# Test Case 4:
str4 = "<"br/>"
print(isValidHTMLTag(str4))
 
# This code is contributed by avanitrachhadiya2155
Output: 
true
true
false
false
false

 

Вниманию читателя! Не прекращайте учиться сейчас. Освойте все важные концепции DSA с помощью самостоятельного курса DSA по приемлемой для студентов цене и будьте готовы к работе в отрасли. Чтобы завершить подготовку от изучения языка к DS Algo и многому другому, см. Полный курс подготовки к собеседованию .

Если вы хотите посещать живые занятия с отраслевыми экспертами, пожалуйста, обращайтесь к Geeks Classes Live и Geeks Classes Live USA.