Удалить расширение имени файла в Java

(Без включения каких-либо внешних библиотек.)

Какой самый эффективный способ удалить расширение имени файла в Java, не предполагая ничего из имени файла?

Некоторые примеры и ожидаемые результаты:

  • папка> папка
  • hello.txt > привет
  • read.me> читать
  • hello.bkp.txt > hello.bkp
  • странно.. имя> странно.
  • .hidden>.hidden

(или последний должен быть просто скрыт?)

Редактировать: исходный вопрос предполагал, что вход является именем файла (не путь к файлу). Поскольку некоторые ответы говорят о путях к файлам, такие функции также должны работать в таких случаях:

  • rare.folder / hello> rare.folder / hello

Этот конкретный случай очень хорошо рассматривается ответом Сильвен М.

10 ответов

Решение

Я собираюсь нанести удар по этому, который использует двухаргументную версию lastIndexOf чтобы удалить какой-то специальный код проверки и, надеюсь, сделать намерение более читабельным. Авторы благодарности Джастину Джингу Нельсону за основу этого метода:

public static String removeExtention(String filePath) {
    // These first few lines the same as Justin's
    File f = new File(filePath);

    // if it's a directory, don't remove the extention
    if (f.isDirectory()) return filePath;

    String name = f.getName();

    // Now we know it's a file - don't need to do any special hidden
    // checking or contains() checking because of:
    final int lastPeriodPos = name.lastIndexOf('.');
    if (lastPeriodPos <= 0)
    {
        // No period after first character - return name as it was passed in
        return filePath;
    }
    else
    {
        // Remove the last period and everything after it
        File renamed = new File(f.getParent(), name.substring(0, lastPeriodPos));
        return renamed.getPath();
    }
}

Для меня это понятнее, чем скрытые файлы в специальном корпусе и файлы, которые не содержат точку. Это также читается яснее, чем я понимаю вашу спецификацию; что-то вроде "удалить последнюю точку и все, что следует за ней, предполагая, что она существует и не является первым символом имени файла".

Обратите внимание, что этот пример также подразумевает строки в качестве входов и выходов. Поскольку большая часть абстракции требует File объектов, было бы немного яснее, если бы это были входы и выходы.

Использование общего ввода-вывода из Apache http://commons.apache.org/io/

public static String removeExtension (Строка имени файла)

К вашему сведению, исходный код здесь:

http://commons.apache.org/proper/commons-io/javadocs/api-release/src-html/org/apache/commons/io/FilenameUtils.html

Арг, я только что попробовал что-то...

System.out.println(FilenameUtils.getExtension(".polop")); // polop
System.out.println(FilenameUtils.removeExtension(".polop")); // empty string

Таким образом, это решение кажется не очень хорошим... Даже с обычным io вам придется поиграть с removeExtension() getExtension() indexOfExtension()...

Это займет путь к файлу, а затем вернет новое имя файла без расширения.

public static String removeExtention(String filePath) {
    File f = new File(filePath);
    // if it's a directory, don't remove the extention
    if (fisDirectory()) return f.getName();
    String name = f.getName();
    // if it is a hidden file
    if (name.startsWith(".")) {
        // if there is no extn, do not rmove one...
        if (name.lastIndexOf('.') == name.indexOf('.')) return name;
    }
    // if there is no extention, don't do anything
    if (!name.contains(".") return name;
    // Otherwise, remove the last 'extension type thing'
    return name.substring(0, name.lastIndexOf('.'))
}

Люди должны заметить, что это было написано на моем нетбуке, в крошечном окне редактора SO. Этот код не предназначен для производства. Он предназначен только для сервера как хороший пример первой попытки того, как бы я удалил расширение из имени файла.

На самом деле это очень просто, если у вас есть правильное имя файла.

В именах файлов Windows символ точки используется только для обозначения расширения. Так что убери точку и все, что после нее.

В unix-подобных именах файлов точка указывает расширение, если оно находится после последнего разделителя ('/') и имеет по крайней мере один символ между ним и последним разделителем (и не является первым символом, если разделителей нет). Найдите последнюю точку, посмотрите, удовлетворяет ли она условиям, и удалите ее и любые завершающие символы, если это так.

Важно, чтобы вы проверили имя файла перед тем, как сделать это, так как этот алгоритм для инвализованного имени файла может сделать что-то неожиданное и сгенерировать правильное имя файла. Поэтому в Windows вам может потребоваться проверить, что после точки нет обратной косой черты или двоеточия.

Если вы не знаете, с каким именем файла вы имеете дело, обработка всех их как Unix поможет вам в этом.

int p=name.lastIndexOf('.');
if (p>0)
  name=name.substring(0,p);

Я сказал "p>0" вместо "p>=0", потому что, если первый символ - точка, мы, вероятно, не хотим стирать все имя целиком, как в вашем примере ".hidden".

Вы хотите на самом деле обновить имя файла на диске или вы просто манипулируете им внутри?

Используйте новый Remover(). Remove (String),

jdb@Vigor14:/tmp/stackru> javac Remover.java && java Remover
folder > folder
hello.txt > hello
read.me > read
hello.bkp.txt > hello.bkp
weird..name > weird.
.hidden > .hidden

Remover.java,

import java.util.*;

public class Remover {

    public static void main(String [] args){
        Map<String, String> tests = new LinkedHashMap<String, String>();
        tests.put("folder", "folder");
        tests.put("hello.txt", "hello");
        tests.put("read.me", "read");
        tests.put("hello.bkp.txt", "hello.bkp");
        tests.put("weird..name", "weird.");
        tests.put(".hidden", ".hidden");

        Remover r = new Remover();
        for(String in: tests.keySet()){
            String actual = r.remove(in);
            log(in+" > " +actual);
            String expected = tests.get(in);
            if(!expected.equals(actual)){
                throw new RuntimeException();
            }
        }
    }

    private static void log(String s){
        System.out.println(s);
    }

    public String remove(String in){
        if(in == null) {
            return null;
        }
        int p = in.lastIndexOf(".");
        if(p <= 0){
            return in;
        }
        return in.substring(0, p);
    }
}

Я знаю регулярное выражение, чтобы сделать это, но в Java я должен написать как 10 строк кода, чтобы сделать простую замену регулярного выражения?

С и без уничтожения скрытых файлов:

^(.*)\..*$
^(..*)\..*$

Регулярное выражение для этих вещей достаточно "быстрое", но неэффективное по сравнению с самым простым из возможных способов: отсканируйте строку с конца и обрежьте ее до первой точки (не включительно). В Java вы могли бы использовать lastIndexOf и подстроку, чтобы взять только ту часть, которая вас интересует. Начальная точка должна рассматриваться как особый случай, и если последнее вхождение "." в начале, вся строка должна быть возвращена.

filename.replace("$(.+)\.\\w+", "\1");

remove() вышеприведенная функция должна быть переписана для поддержки тестовых случаев, таких как LOST.DIR/myfile.txt

    public static String removeExtension( String in )
{
    int p = in.lastIndexOf(".");
    if ( p < 0 )
        return in;

    int d = in.lastIndexOf( File.separator );

    if ( d < 0 && p == 0 )
        return in;

    if ( d >= 0 && d > p )
        return in;

    return in.substring( 0, p );
}
Другие вопросы по тегам