Отформатировать строку в заголовок

Как мне отформатировать строку в заголовок?

20 ответов

Вот простой статический метод, чтобы сделать это в C#:

public static string ToTitleCaseInvariant(string targetString)
{
    return System.Threading.Thread.CurrentThread.CurrentCulture.TextInfo.ToTitleCase(targetString);
}

Я бы с осторожностью относился к автоматическому переводу всех слов, предшествующих пробелу, в сценарии, где я рискую привлечь ярость придира.

Я бы по крайней мере подумал о реализации словаря для исключительных случаев, таких как статьи и союзы. Вот:

"Красавица и Чудовище"

И когда дело доходит до имен собственных, вещь становится намного ужаснее.

Вот решение Perl http://daringfireball.net/2008/05/title_case

Вот решение для Ruby http://frankschmitt.org/projects/title-case

Вот одноруковое решение Ruby: http://snippets.dzone.com/posts/show/4702

'some string here'.gsub(/\b\w/){$&.upcase}

То, что делает однострочный, использует подстановку регулярного выражения первого символа каждого слова его заглавной версией.

Например, чтобы записать его в Си, используйте коды ascii ( http://www.asciitable.com/), чтобы найти целочисленное значение символа и вычтите 32 из него.

Это плохое решение, если вы когда-нибудь планируете принимать символы, отличные от аз и аз.

Например: ASCII 134: å, ASCII 143: Å.
Использование арифметики дает вам: ASCII 102: f

Используйте библиотечные вызовы, не думайте, что вы можете использовать целочисленную арифметику для своих персонажей, чтобы получить что-то полезное. Юникод это сложно.

В Silverlight нет ToTitleCase в TextInfo учебный класс.

Вот простой способ на основе регулярных выражений.

Примечание: Silverlight не имеет предварительно скомпилированных регулярных выражений, но для меня эта потеря производительности не является проблемой.

    public string TitleCase(string str)
    {
        return Regex.Replace(str, @"\w+", (m) =>
        {
            string tmp = m.Value;
            return char.ToUpper(tmp[0]) + tmp.Substring(1, tmp.Length - 1).ToLower();
        });
    }

В Perl:

$string =~ s/(\w+)/\u\L$1/g;

Это даже в FAQ.

В Java вы можете использовать следующий код.

public String titleCase(String str) {
    char[] chars = str.toCharArray();
    for (int i = 0; i < chars.length; i++) {
        if (i == 0) {
            chars[i] = Character.toUpperCase(chars[i]);
        } else if ((i + 1) < chars.length && chars[i] == ' ') {
            chars[i + 1] = Character.toUpperCase(chars[i + 1]);
        }
    }
    return new String(chars);
}

Если используемый вами язык имеет поддерживаемый метод / функцию, просто используйте его (как в C# ToTitleCase метод)

Если этого не произойдет, вы захотите сделать что-то вроде следующего:

  1. Читать в строке
  2. Возьми первое слово
  3. Прописать первую букву этого слова 1
  4. Идите вперед и найдите следующее слово
  5. Перейдите к 3, если не в конце строки, иначе выйдите

1 Чтобы использовать его, например, на языке C, используйте коды ascii, чтобы найти целочисленное значение символа и вычесть 32 из него.

В коде потребуется гораздо больше проверок на ошибки (обеспечение правильности букв и т. Д.), А функция "С заглавной буквы" должна будет наложить на буквы какую-то "схему случая заголовка", чтобы проверять слова, которые не нужны. быть в капитуляции ("и", "но" и т. д. Вот хорошая схема)

На каком языке?

В PHP это так:

ucwords ()

пример:

$HelloWorld = ucwords('hello world');

Excel-подобный PROPER:

public static string ExcelProper(string s) {
    bool upper_needed = true;
    string result = "";
    foreach (char c in s) {
        bool is_letter = Char.IsLetter(c);
        if (is_letter)
            if (upper_needed)
                result += Char.ToUpper(c);
            else
                result += Char.ToLower(c);
        else
            result += c;
        upper_needed = !is_letter;
    }
    return result;
}

http://titlecase.com/ имеет API

Я думаю, что использование CultureInfo не всегда надежно, это простой и удобный способ манипулирования строкой вручную:

string sourceName = txtTextBox.Text.ToLower();
string destinationName = sourceName[0].ToUpper();

for (int i = 0; i < (sourceName.Length - 1); i++) {
  if (sourceName[i + 1] == "")  {
    destinationName += sourceName[i + 1];
  }
  else {
    destinationName += sourceName[i + 1];
  }
}
txtTextBox.Text = desinationName;

Вот реализация в Python: https://launchpad.net/titlecase.py

И порт этой реализации, который я только что сделал в C++: http://codepad.org/RrfcsZzO

Вот простой пример того, как это сделать:

public static string ToTitleCaseInvariant(string str)
{
    return System.Threading.Thread.CurrentThread.CurrentCulture.TextInfo.ToTitleCase(str);
}

Есть встроенная формула PROPER(n) в Excel.

Было очень приятно видеть, что мне не пришлось писать это самому!

В С# вы можете просто использовать

      CultureInfo.InvariantCulture.TextInfo.ToTitleCase(str.ToLowerInvariant())
  • Инвариант
  • Работает со строками в верхнем регистре

В C#

using System.Globalization;  
using System.Threading;  
protected void Page_Load(object sender, EventArgs e)  
{  
  CultureInfo cultureInfo   = Thread.CurrentThread.CurrentCulture;  
  TextInfo textInfo = cultureInfo.TextInfo;  
  Response.Write(textInfo.ToTitleCase("WelcometoHome<br />"));  
  Response.Write(textInfo.ToTitleCase("Welcome to Home"));  
Response.Write(textInfo.ToTitleCase("Welcome@to$home<br/>").Replace("@","").Replace("$", ""));  
}

Здесь у вас есть версия C++. У него есть набор не прописных слов, таких как пронунун и предлоги. Тем не менее, я бы не рекомендовал автоматизировать этот процесс, если вы имеете дело с важными текстами.

#include <iostream>
#include <string>
#include <vector>
#include <cctype>
#include <set>

using namespace std;

typedef vector<pair<string, int> > subDivision;
set<string> nonUpperCaseAble;

subDivision split(string & cadena, string delim = " "){
    subDivision retorno;
    int pos, inic = 0;
    while((pos = cadena.find_first_of(delim, inic)) != cadena.npos){
        if(pos-inic > 0){
            retorno.push_back(make_pair(cadena.substr(inic, pos-inic), inic));
        }
        inic = pos+1;
    }
    if(inic != cadena.length()){
        retorno.push_back(make_pair(cadena.substr(inic, cadena.length() - inic), inic));
    }
    return retorno;
}

string firstUpper (string & pal){
    pal[0] = toupper(pal[0]);
    return pal;
}

int main()
{
    nonUpperCaseAble.insert("the");
    nonUpperCaseAble.insert("of");
    nonUpperCaseAble.insert("in");
    // ...

    string linea, resultado;
    cout << "Type the line you want to convert: " << endl;
    getline(cin, linea);

    subDivision trozos = split(linea);
    for(int i = 0; i < trozos.size(); i++){
        if(trozos[i].second == 0)
        {
            resultado += firstUpper(trozos[i].first);
        }
        else if (linea[trozos[i].second-1] == ' ')
        {
            if(nonUpperCaseAble.find(trozos[i].first) == nonUpperCaseAble.end())
            {
                resultado += " " + firstUpper(trozos[i].first);
            }else{
                resultado += " " + trozos[i].first;
            }
        }
        else
        {
            resultado += trozos[i].first;
        }       
    }

    cout << resultado << endl;
    getchar();
    return 0;
}

С Perl вы можете сделать это:

my $tc_string = join ' ', map { ucfirst($\_) } split /\s+/, $string;

Без использования готовой функции, супер-простой низкоуровневый алгоритм для преобразования строки в регистр заголовка:


convert first character to uppercase.
for each character in string,
    if the previous character is whitespace,
        convert character to uppercase.

Это предполагает, что "преобразовать символ в верхний регистр" будет делать это правильно, независимо от того, является ли символ чувствительным к регистру (например, "+").

Другие вопросы по тегам