Powershell - рекурсивный в хранилище озера данных Azure

Кто-нибудь знает, как перечислить каждый файл в каталоге внутри хранилища озера данных и подкаталогов? по-видимому -recursive инструкция не работает как в обычной среде

Мне нужно запустить этот сценарий в хранилище озера данных Azure (оно правильно работает на моем компьютере)

$Quarentine = "C:\PSTest\QUARENTINE"

$validate = "C:\PSTest\Files"

get-childitem $validate -rec -af | Where-Object {$_.FullName -notmatch "^C:\\PSTest\\Files\\(.+\\)*(XX.+)\.(.+)$"} | 
move-item -destination {"C:\PSTest\QUARENTINE\"+ $_.BaseName +("{0:yyyyMMddHHmmss}" -f (get-date)) + $_.Extension}

Я работаю с командой Get-AzureRmDataLakeStoreChildItem где, по-видимому -recursive не поддерживается.

Может кто-то помочь мне, пожалуйста?

Спасибо

2 ответа

Решение

Вот рекурсивный способ сделать это (предостережение: он плохо масштабируется, поскольку выполняет API-вызов для каждого подкаталога и не распараллеливается, а также потому, что сохраняет все файлы в памяти).

function Get-DataLakeStoreChildItemRecursive ([hashtable] $Params) {
    $AllFiles = New-Object Collections.Generic.List[Microsoft.Azure.Commands.DataLakeStore.Models.DataLakeStoreItem];
    recurseDataLakeStoreChildItem -AllFiles $AllFiles -Params $Params
    $AllFiles
}

function recurseDataLakeStoreChildItem ([System.Collections.ICollection] $AllFiles, [hashtable] $Params) {
    $ChildItems = Get-AzureRmDataLakeStoreChildItem @Params;
    $Path = $Params["Path"];
    foreach ($ChildItem in $ChildItems) {
        switch ($ChildItem.Type) {
            "FILE" {
                $AllFiles.Add($ChildItem);
            }
            "DIRECTORY" {
                $Params.Remove("Path");
                $Params.Add("Path", $Path + "/" + $ChildItem.Name);
                recurseDataLakeStoreChildItem -AllFiles $AllFiles -Params $Params;
            }
        }
    }
}

Get-DataLakeStoreChildItemRecursive -Params @{ 'Path' = '/Samples'; 'Account' = 'youradlsaccount' }

Я выбрал другой подход, но да, ответ был на выполнение моей собственной рекурсивной функции

function Get-DataLakeStoreChildItemRecursive ([string]$path, [string]$account, [string]$quarantine) {

    $dirs = Get-AzureRmDataLakeStoreChildItem -Account $account -Path $path

    foreach ($dir in $dirs) {
        switch ($dir.Type) {
            "FILE" {
                if(($path + $dir.Name) -match "^/adls-dev/raw/amp/(.+/)*(amp.+)\.(.+)$") {
                }
                else {
                    $to = $quarantine + ("{0:yyyyMMddHHmmss}-" -f (get-date)) + $dir.Name
                    Move-AzureRmDataLakeStoreItem -AccountName $account -Path ($path + $dir.Name) -Destination $to
                }
            }
            "DIRECTORY" {
                $q = ($quarantine + $dir.Name + '/')
                $test = Test-AzureRmDataLakeStoreItem -AccountName $account -Path $q

                if($test -eq $False) {
                    New-AzureRmDataLakeStoreItem -AccountName $account -Path $q -Folder
                }

                Get-DataLakeStoreChildItemRecursive ($path + $dir.Name + '/') $account $q
            }
        }
    }
}

Get-DataLakeStoreChildItemRecursive "/adls-dev/raw/amp/" "asdf" "/adls-dev/quarantine/"
Другие вопросы по тегам