Menggunakan os.walk () untuk menelusuri direktori secara rekursif dengan Python


151

Saya ingin menavigasi dari direktori root ke semua direktori lain di dalam dan mencetak yang sama.

Ini kode saya:

#!/usr/bin/python

import os
import fnmatch

for root, dir, files in os.walk("."):
        print root
        print ""
        for items in fnmatch.filter(files, "*"):
                print "..." + items
        print ""

Dan inilah O / P saya:

.

...Python_Notes
...pypy.py
...pypy.py.save
...classdemo.py
....goutputstream-J9ZUXW
...latest.py
...pack.py
...classdemo.pyc
...Python_Notes~
...module-demo.py
...filetype.py

./packagedemo

...classdemo.py
...__init__.pyc
...__init__.py
...classdemo.pyc

Di atas, .dan ./packagedemodirektori.

Namun, saya perlu mencetak O / P dengan cara berikut:

A
---a.txt
---b.txt
---B
------c.out

Di atas, Adan Badalah direktori dan sisanya adalah file.


6
Saya ingin menambahkan posting kecil ini di sini, tentang kekuatan python: >>> print 2 * '-' ----
Nitaai

Jawaban:


228

Ini akan memberi Anda hasil yang diinginkan

#!/usr/bin/python

import os

# traverse root directory, and list directories as dirs and files as files
for root, dirs, files in os.walk("."):
    path = root.split(os.sep)
    print((len(path) - 1) * '---', os.path.basename(root))
    for file in files:
        print(len(path) * '---', file)

6
path = os.path.relpath (root, basepath) .split (os.sep)
Semprini

9
@ Mari menjadi paranoid dan selalu melakukannya os.walk(u".")karena path bisa Unicode.
Ciro Santilli 郝海东 冠状 病 六四 事件 法轮功

3
Lebih baik lagi,os.path.curdir
Jir

Saya telah menggunakan os.path.walkuntuk sementara waktu, jadi os.walkini baru bagi saya! Kacang keren.
Tom

@Emprini apa yang basepathsama dengan dalam kode Anda?
stelios

23

coba ini:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""FileTreeMaker.py: ..."""

__author__  = "legendmohe"

import os
import argparse
import time

class FileTreeMaker(object):

    def _recurse(self, parent_path, file_list, prefix, output_buf, level):
        if len(file_list) == 0 \
            or (self.max_level != -1 and self.max_level <= level):
            return
        else:
            file_list.sort(key=lambda f: os.path.isfile(os.path.join(parent_path, f)))
            for idx, sub_path in enumerate(file_list):
                if any(exclude_name in sub_path for exclude_name in self.exn):
                    continue

                full_path = os.path.join(parent_path, sub_path)
                idc = "┣━"
                if idx == len(file_list) - 1:
                    idc = "┗━"

                if os.path.isdir(full_path) and sub_path not in self.exf:
                    output_buf.append("%s%s[%s]" % (prefix, idc, sub_path))
                    if len(file_list) > 1 and idx != len(file_list) - 1:
                        tmp_prefix = prefix + "┃  "
                    else:
                        tmp_prefix = prefix + "    "
                    self._recurse(full_path, os.listdir(full_path), tmp_prefix, output_buf, level + 1)
                elif os.path.isfile(full_path):
                    output_buf.append("%s%s%s" % (prefix, idc, sub_path))

    def make(self, args):
        self.root = args.root
        self.exf = args.exclude_folder
        self.exn = args.exclude_name
        self.max_level = args.max_level

        print("root:%s" % self.root)

        buf = []
        path_parts = self.root.rsplit(os.path.sep, 1)
        buf.append("[%s]" % (path_parts[-1],))
        self._recurse(self.root, os.listdir(self.root), "", buf, 0)

        output_str = "\n".join(buf)
        if len(args.output) != 0:
            with open(args.output, 'w') as of:
                of.write(output_str)
        return output_str

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("-r", "--root", help="root of file tree", default=".")
    parser.add_argument("-o", "--output", help="output file name", default="")
    parser.add_argument("-xf", "--exclude_folder", nargs='*', help="exclude folder", default=[])
    parser.add_argument("-xn", "--exclude_name", nargs='*', help="exclude name", default=[])
    parser.add_argument("-m", "--max_level", help="max level",
                        type=int, default=-1)
    args = parser.parse_args()
    print(FileTreeMaker().make(args))

Anda akan mendapatkan ini:

root:.
[.]
┣━[.idea]
  ┣━[scopes]
    ┗━scope_settings.xml
  ┣━.name
  ┣━Demo.iml
  ┣━encodings.xml
  ┣━misc.xml
  ┣━modules.xml
  ┣━vcs.xml
  ┗━workspace.xml
┣━[test1]
  ┗━test1.txt
┣━[test2]
  ┣━[test2-2]
    ┗━[test2-3]
        ┣━test2
        ┗━test2-3-1
  ┗━test2
┣━folder_tree_maker.py
┗━tree.py

Halo, saya sangat menyukai skrip Anda, tetapi ini agak terlalu rumit untuk proyek yang sedang saya kerjakan, apakah ada kemungkinan saya bisa menjadikannya sebagai satu fungsi kecil, dengan hanya argumen -r yang ada?
jeff_h

bagaimana cara mencetaknya dalam .txt? Saya mencoba print(FileTreeMaker().make(args),file=tree)tetapi itu memberi saya'charmap' codec can't encode characters in position 17-21: character maps to <undefined>
Luis Felipe

apa singkatan idc
suara

Saya juga menulis sesuatu yang mirip os.listdir(). Milikmu jauh lebih baik; Saya tidak bisa mendapatkan rekursi dengan benar, hanya bekerja 2 atau 3 lapis. Pada akhirnya saya memutuskan untuk mencoba lagi dari awal dengan os.walk(), yang saya pikir akan jauh lebih cocok. Saya terkejut Anda tidak menggunakannya sama sekali di sini.
Suara

11

Ada fungsi yang lebih cocok untuk ini dalam ospaket. Tetapi jika Anda harus menggunakan os.walk, inilah yang saya hasilkan

def walkdir(dirname):
    for cur, _dirs, files in os.walk(dirname):
        pref = ''
        head, tail = os.path.split(cur)
        while head:
            pref += '---'
            head, _tail = os.path.split(head)
        print(pref+tail)
        for f in files:
            print(pref+'---'+f)

keluaran:

>>> walkdir('.')
.
---file3
---file2
---my.py
---file1
---A
------file2
------file1
---B
------file3
------file2
------file4
------file1
---__pycache__
------my.cpython-33.pyc

5
Jadi fungsi apa yang lebih cocok? (dalam 3,5 jika itu penting)
Al Lelopath

Maaf, tidak ada kesempatan untuk mengingat apa yang saya maksud dengan itu. Mungkin saja yang saya maksudkan os.listdirtetapi solusi @ ajay mengalahkan itu.
zaquest

5

Anda dapat menggunakan os.walk, dan itu mungkin solusi yang paling mudah, tetapi di sini ada ide lain untuk dijelajahi:

import sys, os

FILES = False

def main():
    if len(sys.argv) > 2 and sys.argv[2].upper() == '/F':
        global FILES; FILES = True
    try:
        tree(sys.argv[1])
    except:
        print('Usage: {} <directory>'.format(os.path.basename(sys.argv[0])))

def tree(path):
    path = os.path.abspath(path)
    dirs, files = listdir(path)[:2]
    print(path)
    walk(path, dirs, files)
    if not dirs:
        print('No subfolders exist')

def walk(root, dirs, files, prefix=''):
    if FILES and files:
        file_prefix = prefix + ('|' if dirs else ' ') + '   '
        for name in files:
            print(file_prefix + name)
        print(file_prefix)
    dir_prefix, walk_prefix = prefix + '+---', prefix + '|   '
    for pos, neg, name in enumerate2(dirs):
        if neg == -1:
            dir_prefix, walk_prefix = prefix + '\\---', prefix + '    '
        print(dir_prefix + name)
        path = os.path.join(root, name)
        try:
            dirs, files = listdir(path)[:2]
        except:
            pass
        else:
            walk(path, dirs, files, walk_prefix)

def listdir(path):
    dirs, files, links = [], [], []
    for name in os.listdir(path):
        path_name = os.path.join(path, name)
        if os.path.isdir(path_name):
            dirs.append(name)
        elif os.path.isfile(path_name):
            files.append(name)
        elif os.path.islink(path_name):
            links.append(name)
    return dirs, files, links

def enumerate2(sequence):
    length = len(sequence)
    for count, value in enumerate(sequence):
        yield count, count - length, value

if __name__ == '__main__':
    main()

Anda mungkin mengenali dokumentasi berikut dari perintah TREE di terminal Windows:

Graphically displays the folder structure of a drive or path.

TREE [drive:][path] [/F] [/A]

   /F   Display the names of the files in each folder.
   /A   Use ASCII instead of extended characters.

5

Berjalan secara rekursif melalui direktori tempat Anda mendapatkan SEMUA file dari semua direktori di direktori saat ini dan Anda mendapatkan SEMUA direktori dari direktori saat ini - karena kode di atas tidak memiliki kesederhanaan (imho):

for root, dirs, files in os.walk(rootFolderPath):
    for filename in files:
        doSomethingWithFile(os.path.join(root, filename))
    for dirname in dirs:
        doSomewthingWithDir(os.path.join(root, dirname))

3
Jawaban paling membantu. Catatan yang os.path.join(root, filename)memberikan path lengkap ke file, bahkan jika file tersebut bersarang di beberapa direktori.
CLW

4

Ini melakukannya untuk nama folder:

def printFolderName(init_indent, rootFolder):
    fname = rootFolder.split(os.sep)[-1]
    root_levels = rootFolder.count(os.sep)
    # os.walk treats dirs breadth-first, but files depth-first (go figure)
    for root, dirs, files in os.walk(rootFolder):
        # print the directories below the root
        levels = root.count(os.sep) - root_levels
        indent = ' '*(levels*2)
        print init_indent + indent + root.split(os.sep)[-1]

3
#!/usr/bin/python

import os 

def tracing(a):
    global i>
    for item in os.listdir(a):
        if os.path.isfile(item):
            print i + item 
        else:
            print i + item 
            i+=i
            tracing(item)

i = "---"
tracing(".")

1

Diberi nama folder, berjalan melalui seluruh hierarki secara rekursif.

#! /usr/local/bin/python3
# findLargeFiles.py - given a folder name, walk through its entire hierarchy
#                   - print folders and files within each folder

import os

def recursive_walk(folder):
    for folderName, subfolders, filenames in os.walk(folder):
        if subfolders:
            for subfolder in subfolders:
                recursive_walk(subfolder)
        print('\nFolder: ' + folderName + '\n')
        for filename in filenames:
            print(filename + '\n')

recursive_walk('/name/of/folder')

4
Tidak perlu menelepon os.walk secara rekursif, karena sudah meratakan rekursi. Itu sebabnya ia mengembalikan argumen folderName.
gwideman

1

Akan menjadi cara terbaik

def traverse_dir_recur(dir):
    import os
    l = os.listdir(dir)
    for d in l:
        if os.path.isdir(dir + d):
            traverse_dir_recur(dir+  d +"/")
        else:
            print(dir + d)

Tidak bekerja untuk saya di Python3. Saya berasumsi kesalahan dalam dir + d, yang mungkin concat mereka tanpa pemisah direktori. Mungkin lebih baik digunakan os.path.joinuntuk membuat direktori dengan nama file
Zvika

0

Cobalah ini; yang mudah

 #!/usr/bin/python
 import os
 # Creating an empty list that will contain the already traversed paths
 donePaths = []
 def direct(path):
       for paths,dirs,files in os.walk(path):
             if paths not in donePaths:
                    count = paths.count('/')
                    if files:
                          for ele1 in files:
                                print '---------' * (count), ele1
                    if dirs:
                          for ele2 in dirs:
                                print '---------' * (count), ele2
                                absPath = os.path.join(paths,ele2)
              # recursively calling the direct function on each directory
                                direct(absPath)
                   # adding the paths to the list that got traversed 
                                donePaths.append(absPath)

 path = raw_input("Enter any path to get the following Dir Tree ...\n")
 direct(path)

======== OUTPUT di bawah ini ========

 /home/test
 ------------------ b.txt
 ------------------ a.txt
 ------------------ a
 --------------------------- a1.txt
 ------------------ b
 --------------------------- b1.txt
 --------------------------- b2.txt
 --------------------------- cde
 ------------------------------------ cde.txt
 ------------------------------------ cdeDir
 --------------------------------------------- cdeDir.txt
 ------------------ c
 --------------------------- c.txt
 --------------------------- c1
 ------------------------------------ c1.txt
 ------------------------------------ c2.txt

Apa gunanya pemeriksaan untuk jalur yang sudah dilalui? Jika itu untuk mendeteksi loop yang disebabkan oleh tautan, os.walk tampaknya default untuk tidak mengikuti tautan. Apakah ada situasi lain?
gwideman

0

Coba ini:

import os
root_name = next(os.walk("."))[0]
dir_names = next(os.walk("."))[1]
file_names = next(os.walk("."))[2]

Di sini saya menganggap jalur Anda sebagai "." di mana root_file dan direktori lain ada di sana. Jadi, pada dasarnya kami hanya mengulangi seluruh pohon dengan menggunakan panggilan next (), karena os.walk kami hanya fungsi generatif. Dengan melakukan ini kita dapat menyimpan semua Direktori dan nama file masing-masing dalam dir_names dan file_names.


0

Anda juga bisa secara berjalan menelusuri folder dan mencantumkan semua kontennya menggunakan pathlib.Path ()

from pathlib import Path


def check_out_path(target_path, level=0):
    """"
    This function recursively prints all contents of a pathlib.Path object
    """
    def print_indented(folder, level):
        print('\t' * level + folder)

    print_indented(target_path.name, level)
    for file in target_path.iterdir():
        if file.is_dir():
            check_out_path(file, level+1)
        else:
            print_indented(file.name, level+1)


my_path = Path(r'C:\example folder')
check_out_path(my_path)

Keluaran:

example folder
    folder
        textfile3.txt
    textfile1.txt
    textfile2.txt

-3
import os

os.chdir('/your/working/path/')
dir = os.getcwd()
list = sorted(os.listdir(dir))
marks = ""

for s_list in list:
    print marks + s_list
    marks += "---"
    tree_list = sorted(os.listdir(dir + "/" + s_list))
    for i in tree_list:
        print marks + i

Ini tidak terlihat seperti melintasi seluruh pohon.
Semua Pekerja Sangat Penting
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.