StringInfo Classe
Definição
Importante
Algumas informações dizem respeito a um produto pré-lançado que pode ser substancialmente modificado antes de ser lançado. A Microsoft não faz garantias, de forma expressa ou implícita, em relação à informação aqui apresentada.
Fornece funcionalidade para dividir uma cadeia em elementos de texto e iterar por esses elementos.
public ref class StringInfo
public class StringInfo
[System.Serializable]
public class StringInfo
[System.Serializable]
[System.Runtime.InteropServices.ComVisible(true)]
public class StringInfo
type StringInfo = class
[<System.Serializable>]
type StringInfo = class
[<System.Serializable>]
[<System.Runtime.InteropServices.ComVisible(true)>]
type StringInfo = class
Public Class StringInfo
- Herança
-
StringInfo
- Atributos
Exemplos
Este exemplo usa os GetTextElementEnumerator métodos e ParseCombiningCharacters da StringInfo classe para manipular uma cadeia que contém caracteres substitutos e combinadores.
using System;
using System.Text;
using System.Globalization;
public sealed class App {
static void Main() {
// The string below contains combining characters.
String s = "a\u0304\u0308bc\u0327";
// Show each 'character' in the string.
EnumTextElements(s);
// Show the index in the string where each 'character' starts.
EnumTextElementIndexes(s);
}
// Show how to enumerate each real character (honoring surrogates) in a string.
static void EnumTextElements(String s) {
// This StringBuilder holds the output results.
StringBuilder sb = new StringBuilder();
// Use the enumerator returned from GetTextElementEnumerator
// method to examine each real character.
TextElementEnumerator charEnum = StringInfo.GetTextElementEnumerator(s);
while (charEnum.MoveNext()) {
sb.AppendFormat(
"Character at index {0} is '{1}'{2}",
charEnum.ElementIndex, charEnum.GetTextElement(),
Environment.NewLine);
}
// Show the results.
Console.WriteLine("Result of GetTextElementEnumerator:");
Console.WriteLine(sb);
}
// Show how to discover the index of each real character (honoring surrogates) in a string.
static void EnumTextElementIndexes(String s) {
// This StringBuilder holds the output results.
StringBuilder sb = new StringBuilder();
// Use the ParseCombiningCharacters method to
// get the index of each real character in the string.
Int32[] textElemIndex = StringInfo.ParseCombiningCharacters(s);
// Iterate through each real character showing the character and the index where it was found.
for (Int32 i = 0; i < textElemIndex.Length; i++) {
sb.AppendFormat(
"Character {0} starts at index {1}{2}",
i, textElemIndex[i], Environment.NewLine);
}
// Show the results.
Console.WriteLine("Result of ParseCombiningCharacters:");
Console.WriteLine(sb);
}
}
// This code produces the following output:
//
// Result of GetTextElementEnumerator:
// Character at index 0 is 'ā̈'
// Character at index 3 is 'b'
// Character at index 4 is 'ç'
//
// Result of ParseCombiningCharacters:
// Character 0 starts at index 0
// Character 1 starts at index 3
// Character 2 starts at index 4
Imports System.Text
Imports System.Globalization
Public Module Example
Public Sub Main()
' The string below contains combining characters.
Dim s As String = "a" + ChrW(&h0304) + ChrW(&h0308) + "bc" + ChrW(&h0327)
' Show each 'character' in the string.
EnumTextElements(s)
' Show the index in the string where each 'character' starts.
EnumTextElementIndexes(s)
End Sub
' Show how to enumerate each real character (honoring surrogates) in a string.
Sub EnumTextElements(s As String)
' This StringBuilder holds the output results.
Dim sb As New StringBuilder()
' Use the enumerator returned from GetTextElementEnumerator
' method to examine each real character.
Dim charEnum As TextElementEnumerator = StringInfo.GetTextElementEnumerator(s)
Do While charEnum.MoveNext()
sb.AppendFormat("Character at index {0} is '{1}'{2}",
charEnum.ElementIndex,
charEnum.GetTextElement(),
Environment.NewLine)
Loop
' Show the results.
Console.WriteLine("Result of GetTextElementEnumerator:")
Console.WriteLine(sb)
End Sub
' Show how to discover the index of each real character (honoring surrogates) in a string.
Sub EnumTextElementIndexes(s As String)
' This StringBuilder holds the output results.
Dim sb As New StringBuilder()
' Use the ParseCombiningCharacters method to
' get the index of each real character in the string.
Dim textElemIndex() As Integer = StringInfo.ParseCombiningCharacters(s)
' Iterate through each real character showing the character and the index where it was found.
For i As Int32 = 0 To textElemIndex.Length - 1
sb.AppendFormat("Character {0} starts at index {1}{2}",
i, textElemIndex(i), Environment.NewLine)
Next
' Show the results.
Console.WriteLine("Result of ParseCombiningCharacters:")
Console.WriteLine(sb)
End Sub
End Module
' The example displays the following output:
'
' Result of GetTextElementEnumerator:
' Character at index 0 is 'ā̈'
' Character at index 3 is 'b'
' Character at index 4 is 'ç'
'
' Result of ParseCombiningCharacters:
' Character 0 starts at index 0
' Character 1 starts at index 3
' Character 2 starts at index 4
Observações
.NET define um elemento de texto como uma unidade de texto que é apresentada como um único carácter, ou seja, um grafema. Um elemento de texto pode ser um carácter base, um par substituto ou uma sequência combinativa de caracteres. A Norma Unicode define um par substituto como uma representação codificada de caracteres para um único carácter abstrato que consiste numa sequência de duas unidades de código, onde a primeira unidade do par é um substituto alto e a segunda é um substituto baixo. O Padrão Unicode define uma sequência de caracteres combinados como uma combinação de um carácter base e um ou mais caracteres combinados. Um par substituto pode representar um carácter base ou um carácter combinado.
A StringInfo aula permite-lhe trabalhar com uma cadeia como uma série de elementos textuais em vez de objetos individuais Char .
Para instanciar um StringInfo objeto que representa uma cadeia específica, pode fazer uma das seguintes opções:
Chama o StringInfo(String) construtor e passa-lhe a cadeia que o StringInfo objeto deve representar como argumento.
Chame o construtor padrão StringInfo() e atribua a cadeia que o StringInfo objeto deve representar à String propriedade.
Pode trabalhar com os elementos de texto individuais numa cadeia de duas formas:
Enumerando cada elemento do texto. Para isso, chama o GetTextElementEnumerator método e depois chama repetidamente o MoveNext método no objeto devolvido TextElementEnumerator até que o método retorne
false.Chamando o ParseCombiningCharacters método para recuperar um array que contém o índice inicial de cada elemento de texto. Pode então recuperar elementos de texto individuais ao passar esses índices ao SubstringByTextElements método.
O exemplo seguinte ilustra ambas as formas de trabalhar com os elementos de texto numa sequência. Cria duas cordas:
strCombining, que é uma cadeia de caracteres árabes que inclui três elementos de texto com múltiplos Char objetos. O primeiro elemento de texto é o carácter base LETRA ÁRABE ALEF (U+0627), seguido de ÁRABE HAMZA ABAIXO (U+0655) e ÁRABE KASRA (U+0650). O segundo elemento do texto é LETRA ÁRABE HEH (U+0647) seguida de FATHA ÁRABE (U+064E). O terceiro elemento do texto é LETRA ÁRABE BEH (U+0628) seguida de DAMMATAN ÁRABE (U+064C).strSurrogates, que é uma cadeia que inclui três pares substitutos: CINCO TALENTOS ACROFÓNICOS GREGOS (U+10148) do Plano Multilíngue Suplementar, U+20026 do Plano Ideográfico Suplementar, e U+F1001 da área de utilizador privado. A codificação UTF-16 de cada carácter é um par de substitutos que consiste num substituto alto seguido de um substituto baixo.
Cada cadeia é analisada uma vez pelo ParseCombiningCharacters método e depois pelo GetTextElementEnumerator método. Ambos os métodos analisam corretamente os elementos de texto nas duas cadeias e mostram os resultados da operação de análise sintática.
using System;
using System.Globalization;
public class Example
{
public static void Main()
{
// The Unicode code points specify Arabic base characters and
// combining character sequences.
string strCombining = "\u0627\u0655\u0650\u064A\u0647\u064E" +
"\u0627\u0628\u064C";
// The Unicode code points specify private surrogate pairs.
string strSurrogates = Char.ConvertFromUtf32(0x10148) +
Char.ConvertFromUtf32(0x20026) + "a" +
Char.ConvertFromUtf32(0xF1001);
EnumerateTextElements(strCombining);
EnumerateTextElements(strSurrogates);
}
public static void EnumerateTextElements(string str)
{
// Get the Enumerator.
TextElementEnumerator teEnum = null;
// Parse the string using the ParseCombiningCharacters method.
Console.WriteLine("\nParsing with ParseCombiningCharacters:");
int[] teIndices = StringInfo.ParseCombiningCharacters(str);
for (int i = 0; i < teIndices.Length; i++) {
if (i < teIndices.Length - 1)
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
teIndices[i], teIndices[i + 1] - 1,
ShowHexValues(str.Substring(teIndices[i], teIndices[i + 1] -
teIndices[i])));
else
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
teIndices[i], str.Length - 1,
ShowHexValues(str.Substring(teIndices[i])));
}
Console.WriteLine();
// Parse the string with the GetTextElementEnumerator method.
Console.WriteLine("Parsing with TextElementEnumerator:");
teEnum = StringInfo.GetTextElementEnumerator(str);
int teCount = - 1;
while (teEnum.MoveNext()) {
// Displays the current element.
// Both GetTextElement() and Current retrieve the current
// text element. The latter returns it as an Object.
teCount++;
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", teCount,
teEnum.ElementIndex, teEnum.ElementIndex +
teEnum.GetTextElement().Length - 1, ShowHexValues((string)(teEnum.Current)));
}
}
private static string ShowHexValues(string s)
{
string hexString = "";
foreach (var ch in s)
hexString += $"{(ushort)ch:X4} ";
return hexString;
}
}
// The example displays the following output:
// Parsing with ParseCombiningCharacters:
// Text Element 0 (0..2)= 0627 0655 0650
// Text Element 1 (3..3)= 064A
// Text Element 2 (4..5)= 0647 064E
// Text Element 3 (6..6)= 0627
// Text Element 4 (7..8)= 0628 064C
//
// Parsing with TextElementEnumerator:
// Text Element 0 (0..2)= 0627 0655 0650
// Text Element 1 (3..3)= 064A
// Text Element 2 (4..5)= 0647 064E
// Text Element 3 (6..6)= 0627
// Text Element 4 (7..8)= 0628 064C
//
// Parsing with ParseCombiningCharacters:
// Text Element 0 (0..1)= D800 DD48
// Text Element 1 (2..3)= D840 DC26
// Text Element 2 (4..4)= 0061
// Text Element 3 (5..6)= DB84 DC01
//
// Parsing with TextElementEnumerator:
// Text Element 0 (0..1)= D800 DD48
// Text Element 1 (2..3)= D840 DC26
// Text Element 2 (4..4)= 0061
// Text Element 3 (5..6)= DB84 DC01
Imports System.Globalization
Public Module Example
Public Sub Main()
' The Unicode code points specify Arabic base characters and
' combining character sequences.
Dim strCombining As String = ChrW(&H627) & ChrW(&h0655) + ChrW(&H650) &
ChrW(&H64A) & ChrW(&H647) & ChrW(&H64E) & ChrW(&H627) &
ChrW(&H628) & ChrW(&H64C)
' The Unicode code points specify private surrogate pairs.
Dim strSurrogates As String = Char.ConvertFromUtf32(&h10148) +
Char.ConvertFromUtf32(&h20026) + "a" +
Char.ConvertFromUtf32(&hF1001)
EnumerateTextElements(strCombining)
EnumerateTextElements(strSurrogates)
End Sub
Public Sub EnumerateTextElements(str As String)
' Get the Enumerator.
Dim teEnum As TextElementEnumerator = Nothing
' Parse the string using the ParseCombiningCharacters method.
Console.WriteLine()
Console.WriteLine("Parsing with ParseCombiningCharacters:")
Dim teIndices As Integer() = StringInfo.ParseCombiningCharacters(str)
For i As Integer = 0 To teIndices.Length - 1
If i < teIndices.Length - 1 Then
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
TEIndices(i), TEIndices((i + 1)) - 1,
ShowHexValues(str.Substring(TEIndices(i), TEIndices((i + 1)) -
teIndices(i))))
Else
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
teIndices(i), str.Length - 1,
ShowHexValues(str.Substring(teIndices(i))))
End If
Next
Console.WriteLine()
' Parse the string with the GetTextElementEnumerator method.
Console.WriteLine("Parsing with TextElementEnumerator:")
teEnum = StringInfo.GetTextElementEnumerator(str)
Dim TECount As Integer = - 1
While teEnum.MoveNext()
' Prints the current element.
' Both GetTextElement() and Current retrieve the current
' text element. The latter returns it as an Object.
TECount += 1
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", teCount,
teEnum.ElementIndex, teEnum.ElementIndex +
teEnum.GetTextElement().Length - 1, ShowHexValues(CStr(teEnum.Current)))
End While
End Sub
Private Function ShowHexValues(s As String) As String
Dim hexString As String = ""
For Each ch In s
hexString += String.Format("{0:X4} ", Convert.ToUInt16(ch))
Next
Return hexString
End Function
End Module
' The example displays the following output:
' Parsing with ParseCombiningCharacters:
' Text Element 0 (0..2)= 0627 0655 0650
' Text Element 1 (3..3)= 064A
' Text Element 2 (4..5)= 0647 064E
' Text Element 3 (6..6)= 0627
' Text Element 4 (7..8)= 0628 064C
'
' Parsing with TextElementEnumerator:
' Text Element 0 (0..2)= 0627 0655 0650
' Text Element 1 (3..3)= 064A
' Text Element 2 (4..5)= 0647 064E
' Text Element 3 (6..6)= 0627
' Text Element 4 (7..8)= 0628 064C
'
' Parsing with ParseCombiningCharacters:
' Text Element 0 (0..1)= D800 DD48
' Text Element 1 (2..3)= D840 DC26
' Text Element 2 (4..4)= 0061
' Text Element 3 (5..6)= DB84 DC01
'
' Parsing with TextElementEnumerator:
' Text Element 0 (0..1)= D800 DD48
' Text Element 1 (2..3)= D840 DC26
' Text Element 2 (4..4)= 0061
' Text Element 3 (5..6)= DB84 DC01
Notas para Chamadores
Internamente, os métodos da StringInfo classe chamam os métodos da CharUnicodeInfo classe para determinar categorias de caracteres. A partir do .NET Framework 4.6.2, a classificação de caracteres baseia-se no The Unicode Standard, Versão 8.0.0. Para o .NET Framework 4 até ao .NET Framework 4.6.1, baseia-se no The Unicode Standard, Versão 6.3.0. No .NET Core, baseia-se no The Unicode Standard, Versão 8.0.0.
Construtores
| Name | Description |
|---|---|
| StringInfo() |
Inicializa uma nova instância da StringInfo classe. |
| StringInfo(String) |
Inicializa uma nova instância da StringInfo classe numa cadeia especificada. |
Propriedades
| Name | Description |
|---|---|
| LengthInTextElements |
Obtém o número de elementos de texto no objeto atual StringInfo . |
| String |
Obtém ou define o valor do objeto atual StringInfo . |
Métodos
| Name | Description |
|---|---|
| Equals(Object) |
Indica se o objeto atual StringInfo é igual a um objeto especificado. |
| Equals(Object) |
Determina se o objeto especificado é igual ao objeto atual. (Herdado de Object) |
| GetHashCode() |
Calcula um código de hash para o valor do objeto atual StringInfo . |
| GetHashCode() |
Serve como função de hash predefinida. (Herdado de Object) |
| GetNextTextElement(String, Int32) |
Obtém o elemento de texto no índice especificado da cadeia especificada. |
| GetNextTextElement(String) |
Recebe o primeiro elemento de texto numa cadeia especificada. |
| GetTextElementEnumerator(String, Int32) |
Devolve um enumerador que itera pelos elementos de texto da cadeia, começando no índice especificado. |
| GetTextElementEnumerator(String) |
Devolve um enumerador que itera através dos elementos de texto de toda a cadeia. |
| GetType() |
Obtém o Type da instância atual. (Herdado de Object) |
| MemberwiseClone() |
Cria uma cópia superficial do atual Object. (Herdado de Object) |
| ParseCombiningCharacters(String) |
Devolve os índices de cada carácter base, substituto alto ou carácter de controlo dentro da cadeia especificada. |
| SubstringByTextElements(Int32, Int32) |
Recupera uma subcadeia de elementos de texto do objeto atual StringInfo começando a partir de um elemento de texto especificado e continuando através do número especificado de elementos de texto. |
| SubstringByTextElements(Int32) |
Recupera uma subcadeia de elementos de texto do objeto atual StringInfo começando a partir de um elemento de texto especificado e continuando até ao último elemento de texto. |
| ToString() |
Devolve uma cadeia que representa o objeto atual. (Herdado de Object) |