Kernel/x86 - Structure for watchpoints (not used)
[tpg/acess2.git] / KernelLand / Kernel / arch / x86 / mm_virt.c
1 /*
2  * AcessOS Microkernel Version
3  * mm_virt.c
4  * 
5  * Memory Map
6  * 0xE0 - Kernel Base
7  * 0xF0 - Kernel Stacks
8  * 0xFD - Fractals
9  * 0xFE - Unused
10  * 0xFF - System Calls / Kernel's User Code
11  */
12 #define DEBUG   0
13 #define SANITY  1
14 #include <acess.h>
15 #include <mm_virt.h>
16 #include <mm_phys.h>
17 #include <proc.h>
18 #include <hal_proc.h>
19 #include <arch_int.h>
20 #include <semaphore.h>
21
22 #include "include/vmem_layout.h"
23
24 #define TRACE_MAPS      0
25
26 #define KWATCH_BUCKETS  512
27
28 #define TAB     22
29
30 #define PF_PRESENT      0x01
31 #define PF_WRITE        0x02
32 #define PF_USER         0x04
33 #define PF_PAGEWT       0x08    // Page-level write through
34 #define PF_PAGECD       0x10    // Page-level cache disable
35 #define PF_ACCESSED     0x20
36 #define PF_DIRTY        0x40
37 #define PF_PAT          0x80    // ?
38 #define PF_GLOBAL       0x100   // Global Page
39 #define PF_COW          0x200   // [ 9] Ignored - Copy-on-write
40 #define PF_NOPAGE       0x400   // [10] Ignored - Disable page-out
41 #define PF_WATCHED      0x800   // [11] Ignored - Watchpointing enabled
42
43 #define INVLPG(addr)    __asm__ __volatile__ ("invlpg (%0)"::"r"(addr))
44
45 #define GET_TEMP_MAPPING(cr3) do { \
46         __ASM__("cli"); \
47         __AtomicTestSetLoop( (Uint *)gpTmpCR3, cr3 | 3 ); \
48 } while(0)
49 #define REL_TEMP_MAPPING() do { \
50         *gpTmpCR3 = 0; \
51         __ASM__("sti"); \
52 } while(0)
53
54 typedef Uint32  tTabEnt;
55
56 // === IMPORTS ===
57 extern tPage    _UsertextEnd;
58 extern tPage    _UsertextBase;
59 extern tPage    gKernelEnd;     // defined as page aligned
60 extern Uint32   gaInitPageDir[1024];
61 extern Uint32   gaInitPageTable[1024];
62 extern void     Threads_SegFault(tVAddr Addr);
63
64 typedef struct sWatchpoint
65 {
66         struct sWatchpoint      *Next;
67         Uint    PageNum;
68         Uint8   Bitmap[PAGE_SIZE/4/8];
69 } tWatchpoint;
70
71 // === PROTOTYPES ===
72 void    MM_PreinitVirtual(void);
73 void    MM_InstallVirtual(void);
74 void    MM_PageFault(tVAddr Addr, Uint ErrorCode, tRegs *Regs);
75 void    MM_DumpTables_Print(tVAddr Start, Uint32 Orig, size_t Size, void *Node);
76 //void  MM_DumpTables(tVAddr Start, tVAddr End);
77 //void  MM_ClearUser(void);
78 tPAddr  MM_DuplicatePage(tVAddr VAddr);
79
80 // === GLOBALS ===
81 #define gaPageTable     ((tTabEnt*)PAGE_TABLE_ADDR)
82 #define gaPageDir       ((tTabEnt*)PAGE_DIR_ADDR)
83 #define gaTmpTable      ((tTabEnt*)TMP_TABLE_ADDR)
84 #define gaTmpDir        ((tTabEnt*)TMP_DIR_ADDR)
85 #define gpPageCR3       ((tTabEnt*)PAGE_CR3_ADDR)
86 #define gpTmpCR3        ((tTabEnt*)TMP_CR3_ADDR)
87
88 #define gaPAE_PageTable ((tTabEnt*)PAE_PAGE_TABLE_ADDR)
89 #define gaPAE_PageDir   ((tTabEnt*)PAE_PAGE_DIR_ADDR)
90 #define gaPAE_MainPDPT  ((tTabEnt*)PAE_PAGE_PDPT_ADDR)
91 #define gaPAE_TmpTable  ((tTabEnt*)PAE_TMP_DIR_ADDR)
92 #define gaPAE_TmpDir    ((tTabEnt*)PAE_TMP_DIR_ADDR)
93 #define gaPAE_TmpPDPT   ((tTabEnt*)PAE_TMP_PDPT_ADDR)
94  int    gbUsePAE = 0;
95 tMutex  glTempMappings;
96 tSemaphore      gTempMappingsSem;
97 tMutex  glTempFractal;
98 Uint32  gWorkerStacks[(NUM_WORKER_STACKS+31)/32];
99  int    giLastUsedWorker = 0;
100 struct sPageInfo {
101         void    *Node;
102         tVAddr  Base;
103         Uint64  Offset;
104          int    Length;
105          int    Flags;
106 }       *gaMappedRegions;       // sizeof = 24 bytes
107 // - Zero page
108 tShortSpinlock  glMM_ZeroPage;
109 tPAddr  giMM_ZeroPage;
110 tWatchpoint     *gapKernelWatchpoints[KWATCH_BUCKETS];
111
112 // === CODE ===
113 /**
114  * \fn void MM_PreinitVirtual(void)
115  * \brief Maps the fractal mappings
116  */
117 void MM_PreinitVirtual(void)
118 {
119         gaInitPageDir[ PAGE_TABLE_ADDR >> 22 ] = ((tTabEnt)&gaInitPageDir - KERNEL_BASE) | 3;
120         INVLPG( PAGE_TABLE_ADDR );
121         
122         Semaphore_Init(&gTempMappingsSem, NUM_TEMP_PAGES, NUM_TEMP_PAGES, "MMVirt", "Temp Mappings");
123 }
124
125 /**
126  * \fn void MM_InstallVirtual(void)
127  * \brief Sets up the constant page mappings
128  */
129 void MM_InstallVirtual(void)
130 {
131         // Don't bother referencing, as it'a in the kernel area
132         //MM_RefPhys( gaInitPageDir[ PAGE_TABLE_ADDR >> 22 ] );
133         // --- Pre-Allocate kernel tables
134         for( int i = KERNEL_BASE>>22; i < 1024; i ++ )
135         {
136                 if( gaPageDir[ i ] ) {
137                 //      MM_RefPhys( gaPageDir[ i ] & ~0xFFF );
138                         continue;
139                 }       
140                 // Skip stack tables, they are process unique
141                 if( i > MM_KERNEL_STACKS >> 22 && i < MM_KERNEL_STACKS_END >> 22) {
142                         gaPageDir[ i ] = 0;
143                         continue;
144                 }
145                 // Preallocate table
146                 gaPageDir[ i ] = MM_AllocPhys() | 3;
147                 INVLPG( &gaPageTable[i*1024] );
148                 memset( &gaPageTable[i*1024], 0, 0x1000 );
149         }
150         
151         // Unset kernel on the User Text pages
152         ASSERT( ((tVAddr)&_UsertextBase & (PAGE_SIZE-1)) == 0 );
153         //ASSERT( ((tVAddr)&_UsertextEnd & (PAGE_SIZE-1)) == 0 );
154         for( tPage *page = &_UsertextBase; page < &_UsertextEnd; page ++ )
155         {
156                 MM_SetFlags( page, 0, MM_PFLAG_KERNEL );
157         }
158
159         // Unmap the area between end of kernel image and the heap
160         // DISABLED: Assumptions in main.c
161         #if 0
162         for( tPage *page = &gKernelEnd; page < (tPage*)(KERNEL_BASE+4*1024*1024); page ++ )
163         {
164                 gaPageTable[ (tVAddr)page / PAGE_SIZE ] = 0;
165                 //MM_Deallocate(page);
166         }
167         #endif
168
169         *gpTmpCR3 = 0;
170 }
171
172 /**
173  * \brief Cleans up the SMP required mappings
174  */
175 void MM_FinishVirtualInit(void)
176 {
177         gaInitPageDir[ 0 ] = 0;
178 }
179
180 /**
181  * \fn void MM_PageFault(tVAddr Addr, Uint ErrorCode, tRegs *Regs)
182  * \brief Called on a page fault
183  */
184 void MM_PageFault(tVAddr Addr, Uint ErrorCode, tRegs *Regs)
185 {
186         Uint32  *pde = &gaPageDir[Addr>>22];
187         Uint32  *pte = &gaPageTable[Addr>>12];
188         //ENTER("xAddr bErrorCode", Addr, ErrorCode);
189         
190         // -- Check for COW --
191         if( (*pde & PF_PRESENT) && (*pte & PF_PRESENT) && (*pte & PF_COW) )
192         {
193                 tPAddr  paddr;
194                 __asm__ __volatile__ ("sti");
195                 if( MM_GetRefCount( *pte & ~0xFFF ) == 1 )
196                 {
197                         *pte &= ~PF_COW;
198                         *pte |= PF_PRESENT|PF_WRITE;
199                 }
200                 else
201                 {
202                         //Log("MM_PageFault: COW - MM_DuplicatePage(0x%x)", Addr);
203                         paddr = MM_DuplicatePage( Addr );
204                         MM_DerefPhys( *pte & ~0xFFF );
205                         *pte &= PF_USER;
206                         *pte |= paddr|PF_PRESENT|PF_WRITE;
207                 }
208                 
209 //              Log_Debug("MMVirt", "COW for %p (%P)", Addr, gaPageTable[Addr>>12]);
210                 
211                 INVLPG( Addr & ~0xFFF );
212                 return;
213         }
214
215         // --- Check for write to controlled area ---
216         // TODO: Catch user access
217         if( (*pde & PF_PRESENT) && (*pte & PF_PRESENT) && !(*pte & PF_WRITE) && (*pte & PF_WATCHED) )
218         {
219                 Uint    page = Addr >> 12;
220                 Uint    ofs = Addr & 0xFFF;
221                 // Watchpoints are active for this page.
222                 // > Locate watchpoint bitmap for page (dword granuality)
223                 tWatchpoint     *wp = ( Addr >= KERNEL_BASE ? gapKernelWatchpoints[page%KWATCH_BUCKETS] : NULL);
224                 while( wp && wp->PageNum == page )
225                         wp = wp->Next;
226                 if( !wp )
227                 {
228                         Log_Warning("MMVirt", "PF_WATCHED set on %p but no watchpoint info avaliable", Addr);
229                 }
230                 else
231                 {
232                         // > If bit set, log/raise
233                         if( wp->Bitmap[ (ofs/4)/8 ] & (1 << (ofs/4)%8) )
234                         {
235                                 Log_Error("DEBUG", "Watchpoint %p written by %x:%p",
236                                         Addr, Regs->cs, Regs->eip);
237                         }
238                         Regs->eflags |= 1<<8;
239                         //Proc_GetCurThread()->Proc.WPPage = Addr;
240                 }
241                 // > Clear write protection, set tracing
242                 *pte |= PF_WRITE;
243                 INVLPG( Addr & ~0xFFF );
244                 return ;
245         }
246
247         // Disable instruction tracing  
248         __ASM__("pushf; andw $0xFEFF, 0(%esp); popf");
249         Proc_GetCurThread()->bInstrTrace = 0;
250
251         // If it was a user, tell the thread handler
252         if(ErrorCode & 4) {
253                 __asm__ __volatile__ ("sti");
254                 Log_Warning("MMVirt", "User %s %s memory%s",
255                         (ErrorCode&2?"write to":"read from"),
256                         (ErrorCode&1?"bad/locked":"non-present"),
257                         (ErrorCode&16?" (Instruction Fetch)":"")
258                         );
259                 Log_Warning("MMVirt", "Instruction %04x:%08x accessed %p", Regs->cs, Regs->eip, Addr);
260                 __ASM__("sti"); // Restart IRQs
261                 #if 1
262                 Error_Backtrace(Regs->eip, Regs->ebp);
263                 #endif
264                 Threads_SegFault(Addr);
265                 return ;
266         }
267         
268         Debug_KernelPanic();
269         
270         // -- Check Error Code --
271         if(ErrorCode & 8)
272                 Warning("Reserved Bits Trashed!");
273         else
274         {
275                 Warning("Kernel %s %s memory%s",
276                         (ErrorCode&2?"write to":"read from"),
277                         (ErrorCode&1?"bad/locked":"non-present"),
278                         (ErrorCode&16?" (Instruction Fetch)":"")
279                         );
280         }
281         
282         Log("CPU %i - Code at %p accessed %p", GetCPUNum(), Regs->eip, Addr);
283         // Print Stack Backtrace
284         Error_Backtrace(Regs->eip, Regs->ebp);
285
286         #if 0   
287         Log("gaPageDir[0x%x] = 0x%x", Addr>>22, gaPageDir[Addr>>22]);
288         if( gaPageDir[Addr>>22] & PF_PRESENT )
289                 Log("gaPageTable[0x%x] = 0x%x", Addr>>12, gaPageTable[Addr>>12]);
290         #endif
291         //MM_DumpTables(0, -1); 
292         
293         // Register Dump
294         Log("EAX %08x ECX %08x EDX %08x EBX %08x", Regs->eax, Regs->ecx, Regs->edx, Regs->ebx);
295         Log("ESP %08x EBP %08x ESI %08x EDI %08x", Regs->esp, Regs->ebp, Regs->esi, Regs->edi);
296         //Log("SS:ESP %04x:%08x", Regs->ss, Regs->esp);
297         Log("CS:EIP %04x:%08x", Regs->cs, Regs->eip);
298         Log("DS %04x ES %04x FS %04x GS %04x", Regs->ds, Regs->es, Regs->fs, Regs->gs);
299         {
300                 Uint    dr0, dr1;
301                 __ASM__ ("mov %%dr0, %0":"=r"(dr0):);
302                 __ASM__ ("mov %%dr1, %0":"=r"(dr1):);
303                 Log("DR0 %08x DR1 %08x", dr0, dr1);
304         }
305         
306         Panic("Page Fault at 0x%x (Accessed 0x%x)", Regs->eip, Addr);
307 }
308
309 void MM_DumpTables_Print(tVAddr Start, Uint32 Orig, size_t Size, void *Node)
310 {
311         if( (Orig & ~(PAGE_SIZE-1)) == giMM_ZeroPage )
312         {
313                 Log( "0x%08x => ZERO + 0x%08x (%s%s%s%s%s) %p",
314                         Start,
315                         Size,
316                         (Orig & PF_NOPAGE ? "P" : "-"),
317                         (Orig & PF_COW ? "C" : "-"),
318                         (Orig & PF_GLOBAL ? "G" : "-"),
319                         (Orig & PF_USER ? "U" : "-"),
320                         (Orig & PF_WRITE ? "W" : "-"),
321                         Node
322                         );
323         }
324         else
325         {
326                 Log(" 0x%08x => 0x%08x + 0x%08x (%s%s%s%s%s) %p",
327                         Start,
328                         Orig & ~0xFFF,
329                         Size,
330                         (Orig & PF_NOPAGE ? "P" : "-"),
331                         (Orig & PF_COW ? "C" : "-"),
332                         (Orig & PF_GLOBAL ? "G" : "-"),
333                         (Orig & PF_USER ? "U" : "-"),
334                         (Orig & PF_WRITE ? "W" : "-"),
335                         Node
336                         );
337         }
338 }
339
340 /**
341  * \fn void MM_DumpTables(tVAddr Start, tVAddr End)
342  * \brief Dumps the layout of the page tables
343  */
344 void MM_DumpTables(tVAddr Start, tVAddr End)
345 {
346         tVAddr  rangeStart = 0;
347         tPAddr  expected = 0;
348         void    *expected_node = NULL, *tmpnode = NULL;
349         tVAddr  curPos;
350         Uint    page;
351         const tPAddr    MASK = ~0xF78;
352         
353         Start >>= 12;   End >>= 12;
354         
355         #if 0
356         Log("Directory Entries:");
357         for(page = Start >> 10;
358                 page < (End >> 10)+1;
359                 page ++)
360         {
361                 if(gaPageDir[page])
362                 {
363                         Log(" 0x%08x-0x%08x :: 0x%08x",
364                                 page<<22, ((page+1)<<22)-1,
365                                 gaPageDir[page]&~0xFFF
366                                 );
367                 }
368         }
369         #endif
370         
371         Log("Table Entries:");
372         for(page = Start, curPos = Start<<12;
373                 page < End;
374                 curPos += 0x1000, page++)
375         {
376                 if( !(gaPageDir[curPos>>22] & PF_PRESENT)
377                 ||  !(gaPageTable[page] & PF_PRESENT)
378                 ||  (gaPageTable[page] & MASK) != expected
379                 ||  (tmpnode=NULL,MM_GetPageNode(expected, &tmpnode), tmpnode != expected_node))
380                 {
381                         if(expected) {
382                                 tPAddr  orig = gaPageTable[rangeStart>>12];
383                                 MM_DumpTables_Print(rangeStart, orig, curPos - rangeStart, expected_node);
384                                 expected = 0;
385                         }
386                         if( !(gaPageDir[curPos>>22] & PF_PRESENT) )     continue;
387                         if( !(gaPageTable[curPos>>12] & PF_PRESENT) )   continue;
388                         
389                         expected = (gaPageTable[page] & MASK);
390                         MM_GetPageNode(expected, &expected_node);
391                         rangeStart = curPos;
392                 }
393                 if(expected && (expected & ~(PAGE_SIZE-1)) != giMM_ZeroPage)
394                         expected += 0x1000;
395         }
396         
397         if(expected) {
398                 tPAddr  orig = gaPageTable[rangeStart>>12];
399                 MM_DumpTables_Print(rangeStart, orig, curPos - rangeStart, expected_node);
400                 expected = 0;
401         }
402 }
403
404 /**
405  * \fn tPAddr MM_Allocate(tVAddr VAddr)
406  */
407 tPAddr MM_Allocate(volatile void * VAddr)
408 {
409         tPAddr  paddr = MM_AllocPhys();
410         if( MM_Map(VAddr, paddr) )
411         {
412                 return paddr;
413         }
414         
415         // Error of some form, either an overwrite or OOM
416         MM_DerefPhys(paddr);
417         
418         // Check for overwrite
419         paddr = MM_GetPhysAddr(VAddr);
420         if( paddr != 0 ) {
421                 Warning("MM_Allocate - Allocating to used address (%p)", VAddr);
422                 return paddr;
423         }
424         
425         // OOM
426         Warning("MM_Allocate - Out of Memory (Called by %p)", __builtin_return_address(0));
427         return 0;
428 }
429
430 void MM_AllocateZero(volatile void *VAddr)
431 {
432         if( MM_GetPhysAddr(VAddr) ) {
433                 Warning("MM_AllocateZero - Attempted overwrite at %p", VAddr);
434                 return ;
435         }
436         if( !giMM_ZeroPage )
437         {
438                 SHORTLOCK(&glMM_ZeroPage);
439                 // Check again within the lock (just in case we lost the race)
440                 if( giMM_ZeroPage == 0 )
441                 {
442                         giMM_ZeroPage = MM_Allocate(VAddr);
443                         // - Reference a second time to prevent it from being freed
444                         MM_RefPhys(giMM_ZeroPage);
445                         memset((void*)VAddr, 0, PAGE_SIZE);
446                 }
447                 SHORTREL(&glMM_ZeroPage);
448         }
449         else
450         {
451                 MM_Map(VAddr, giMM_ZeroPage);
452                 MM_RefPhys(giMM_ZeroPage);
453         }
454         MM_SetFlags(VAddr, MM_PFLAG_COW, MM_PFLAG_COW);
455 }
456
457 /**
458  * \fn int MM_Map(tVAddr VAddr, tPAddr PAddr)
459  * \brief Map a physical page to a virtual one
460  */
461 int MM_Map(volatile void *VAddr, tPAddr PAddr)
462 {
463         Uint    pagenum = (tVAddr)VAddr >> 12;
464         
465         #if TRACE_MAPS
466         Debug("MM_Map(%p, %P)", VAddr, PAddr);
467         #endif
468
469         // Sanity check
470         if( (PAddr & 0xFFF) || ((tVAddr)VAddr & 0xFFF) ) {
471                 Log_Warning("MM_Virt", "MM_Map - Physical or Virtual Addresses are not aligned (%P and %p) - %p",
472                         PAddr, VAddr, __builtin_return_address(0));
473                 //LEAVE('i', 0);
474                 return 0;
475         }
476         
477         bool    is_user = ((tVAddr)VAddr < MM_USER_MAX);
478
479         // Check if the directory is mapped
480         if( gaPageDir[ pagenum >> 10 ] == 0 )
481         {
482                 tPAddr  tmp = MM_AllocPhys();
483                 if( tmp == 0 )
484                         return 0;
485                 gaPageDir[ pagenum >> 10 ] = tmp | 3 | (is_user ? PF_USER : 0);
486                 
487                 INVLPG( &gaPageTable[ pagenum & ~0x3FF ] );
488                 memsetd( &gaPageTable[ pagenum & ~0x3FF ], 0, 1024 );
489         }
490         // Check if the page is already allocated
491         else if( gaPageTable[ pagenum ] != 0 ) {
492                 Warning("MM_Map - Allocating to used address");
493                 //LEAVE('i', 0);
494                 return 0;
495         }
496         
497         // Map
498         gaPageTable[ pagenum ] = PAddr | 3 | (is_user ? PF_USER : 0);
499         
500         INVLPG( VAddr );
501         
502         return 1;
503 }
504
505 /*
506  * A.k.a MM_Unmap
507  */
508 void MM_Deallocate(volatile void *VAddr)
509 {
510         Uint    pagenum = (tVAddr)VAddr >> 12;
511         if( gaPageDir[pagenum>>10] == 0 ) {
512                 Warning("MM_Deallocate - Directory not mapped");
513                 return;
514         }
515         
516         if(gaPageTable[pagenum] == 0) {
517                 Warning("MM_Deallocate - Page is not allocated");
518                 return;
519         }
520         
521         // Dereference and clear page
522         tPAddr  paddr = gaPageTable[pagenum] & ~0xFFF;
523         gaPageTable[pagenum] = 0;
524         MM_DerefPhys( paddr );
525 }
526
527 /**
528  * \fn tPAddr MM_GetPhysAddr(tVAddr Addr)
529  * \brief Checks if the passed address is accesable
530  */
531 tPAddr MM_GetPhysAddr(volatile const void *Addr)
532 {
533         tVAddr  addr = (tVAddr)Addr;
534         if( !(gaPageDir[addr >> 22] & 1) )
535                 return 0;
536         if( !(gaPageTable[addr >> 12] & 1) )
537                 return 0;
538         return (gaPageTable[addr >> 12] & ~0xFFF) | (addr & 0xFFF);
539 }
540
541 /**
542  * \fn void MM_SetCR3(Uint CR3)
543  * \brief Sets the current process space
544  */
545 void MM_SetCR3(Uint CR3)
546 {
547         __ASM__("mov %0, %%cr3"::"r"(CR3));
548 }
549
550 /**
551  * \brief Clear user's address space
552  */
553 void MM_ClearUser(void)
554 {
555         Uint    i, j;
556         
557         for( i = 0; i < (MM_USER_MAX>>22); i ++ )
558         {
559                 // Check if directory is not allocated
560                 if( !(gaPageDir[i] & PF_PRESENT) ) {
561                         gaPageDir[i] = 0;
562                         continue;
563                 }
564                 
565                 // Deallocate tables
566                 for( j = 0; j < 1024; j ++ )
567                 {
568                         if( gaPageTable[i*1024+j] & 1 )
569                                 MM_DerefPhys( gaPageTable[i*1024+j] & ~0xFFF );
570                         gaPageTable[i*1024+j] = 0;
571                 }
572                 
573                 // Deallocate directory
574                 MM_DerefPhys( gaPageDir[i] & ~0xFFF );
575                 gaPageDir[i] = 0;
576                 INVLPG( &gaPageTable[i*1024] );
577         }
578         INVLPG( gaPageDir );
579 }
580
581 /**
582  * \brief Deallocate an address space
583  */
584 void MM_ClearSpace(Uint32 CR3)
585 {
586          int    i, j;
587         
588         if(CR3 == (*gpPageCR3 & ~0xFFF)) {
589                 Log_Error("MMVirt", "Can't clear current address space");
590                 return ;
591         }
592
593         if( MM_GetRefCount(CR3) > 1 ) {
594                 MM_DerefPhys(CR3);
595                 Log_Log("MMVirt", "CR3 %P is still referenced, not cleaning (but dereferenced)", CR3);
596                 return ;
597         }
598
599         Log_Debug("MMVirt", "Clearing out address space 0x%x from 0x%x", CR3, *gpPageCR3);
600         
601         GET_TEMP_MAPPING(CR3);
602         INVLPG( gaTmpDir );
603
604         for( i = 0; i < 1024; i ++ )
605         {
606                 Uint32  *table = &gaTmpTable[i*1024];
607                 if( !(gaTmpDir[i] & PF_PRESENT) )
608                         continue ;
609
610                 INVLPG( table );        
611
612                 if( i < 768 || (i > MM_KERNEL_STACKS >> 22 && i < MM_KERNEL_STACKS_END >> 22) )
613                 {
614                         for( j = 0; j < 1024; j ++ )
615                         {
616                                 if( !(table[j] & 1) )
617                                         continue;
618                                 MM_DerefPhys( table[j] & ~0xFFF );
619                         }
620                 }
621
622                 if( i != (PAGE_TABLE_ADDR >> 22) )
623                 {               
624                         MM_DerefPhys( gaTmpDir[i] & ~0xFFF );
625                 }
626         }
627
628
629         MM_DerefPhys( CR3 );
630
631         REL_TEMP_MAPPING();
632 }
633
634 /**
635  * \fn tPAddr MM_Clone(void)
636  * \brief Clone the current address space
637  */
638 tPAddr MM_Clone(int bNoUserCopy)
639 {
640         Uint    i, j;
641         tPAddr  ret;
642         Uint    page = 0;
643         tVAddr  kStackBase = Proc_GetCurThread()->KernelStack - MM_KERNEL_STACK_SIZE;
644         
645         // Create Directory Table
646         ret = MM_AllocPhys();
647         if( ret == 0 ) {
648                 return 0;
649         }
650         
651         // Map
652         GET_TEMP_MAPPING( ret );
653         INVLPG( gaTmpDir );
654         memsetd( gaTmpDir, 0, 1024 );
655         
656         if( Threads_GetPID() != 0 && !bNoUserCopy )
657         {       
658                 // Copy Tables
659                 for( i = 0; i < 768; i ++)
660                 {
661                         // Check if table is allocated
662                         if( !(gaPageDir[i] & PF_PRESENT) ) {
663                                 gaTmpDir[i] = 0;
664                                 page += 1024;
665                                 continue;
666                         }
667                         
668                         // Allocate new table
669                         gaTmpDir[i] = MM_AllocPhys() | (gaPageDir[i] & 7);
670                         INVLPG( &gaTmpTable[page] );
671                         // Fill
672                         for( j = 0; j < 1024; j ++, page++ )
673                         {
674                                 if( !(gaPageTable[page] & PF_PRESENT) ) {
675                                         gaTmpTable[page] = 0;
676                                         continue;
677                                 }
678                                 
679                                 // Refrence old page
680                                 MM_RefPhys( gaPageTable[page] & ~0xFFF );
681                                 // Add to new table
682                                 if(gaPageTable[page] & PF_WRITE) {
683                                         gaTmpTable[page] = (gaPageTable[page] & ~PF_WRITE) | PF_COW;
684                                         gaPageTable[page] = (gaPageTable[page] & ~PF_WRITE) | PF_COW;
685                                         INVLPG( page << 12 );
686                                 }
687                                 else
688                                         gaTmpTable[page] = gaPageTable[page];
689                         }
690                 }
691         }
692         
693         // Map in kernel tables (and make fractal mapping)
694         for( i = 768; i < 1024; i ++ )
695         {
696                 // Fractal
697                 if( i == (PAGE_TABLE_ADDR >> 22) ) {
698                         gaTmpDir[ PAGE_TABLE_ADDR >> 22 ] = *gpTmpCR3;
699                         continue;
700                 }
701                 if( i == (TMP_TABLE_ADDR >> 22) ) {
702                         gaTmpDir[ TMP_TABLE_ADDR >> 22 ] = 0;
703                         continue ;
704                 }
705                 
706                 if( gaPageDir[i] == 0 ) {
707                         gaTmpDir[i] = 0;
708                         continue;
709                 }
710                 
711                 //LOG("gaPageDir[%x/4] = 0x%x", i*4, gaPageDir[i]);
712                 MM_RefPhys( gaPageDir[i] & ~0xFFF );
713                 gaTmpDir[i] = gaPageDir[i];
714         }
715         
716         // Allocate kernel stack
717         for(i = MM_KERNEL_STACKS >> 22; i < MM_KERNEL_STACKS_END >> 22; i ++ )
718         {
719                 // Check if directory is allocated
720                 if( (gaPageDir[i] & 1) == 0 ) {
721                         gaTmpDir[i] = 0;
722                         continue;
723                 }               
724                 
725                 // We don't care about other kernel stacks, just the current one
726                 if( i != kStackBase >> 22 ) {
727                         MM_DerefPhys( gaPageDir[i] & ~0xFFF );
728                         gaTmpDir[i] = 0;
729                         continue;
730                 }
731                 
732                 // Create a copy
733                 gaTmpDir[i] = MM_AllocPhys() | 3;
734                 INVLPG( &gaTmpTable[i*1024] );
735                 for( j = 0; j < 1024; j ++ )
736                 {
737                         // Is the page allocated? If not, skip
738                         if( !(gaPageTable[i*1024+j] & 1) ) {
739                                 gaTmpTable[i*1024+j] = 0;
740                                 continue;
741                         }
742                         
743                         // We don't care about other kernel stacks
744                         if( ((i*1024+j)*4096 & ~(MM_KERNEL_STACK_SIZE-1)) != kStackBase ) {
745                                 gaTmpTable[i*1024+j] = 0;
746                                 continue;
747                         }
748                         
749                         // Allocate page
750                         gaTmpTable[i*1024+j] = MM_AllocPhys() | 3;
751                         
752                         void *tmp = MM_MapTemp( gaTmpTable[i*1024+j] & ~0xFFF );
753                         memcpy( tmp, (void *)( (i*1024+j)*PAGE_SIZE ), PAGE_SIZE );
754                         MM_FreeTemp( tmp );
755                 }
756         }
757         
758         REL_TEMP_MAPPING();
759         
760         //LEAVE('x', ret);
761         return ret;
762 }
763
764 /**
765  * \fn tVAddr MM_NewKStack(void)
766  * \brief Create a new kernel stack
767  */
768 tVAddr MM_NewKStack(void)
769 {
770         for(tVAddr base = MM_KERNEL_STACKS; base < MM_KERNEL_STACKS_END; base += MM_KERNEL_STACK_SIZE)
771         {
772                 tPage   *pageptr = (void*)base;
773                 // Check if space is free
774                 if(MM_GetPhysAddr(pageptr) != 0)
775                         continue;
776                 // Allocate
777                 for(Uint i = 0; i < MM_KERNEL_STACK_SIZE/PAGE_SIZE; i ++ )
778                 {
779                         if( MM_Allocate(pageptr + i) == 0 )
780                         {
781                                 // On error, print a warning and return error
782                                 Warning("MM_NewKStack - Out of memory");
783                                 // - Clean up
784                                 //for( i += 0x1000 ; i < MM_KERNEL_STACK_SIZE; i += 0x1000 )
785                                 //      MM_Deallocate(base+i);
786                                 return 0;
787                         }
788                 }
789                 // Success
790 //              Log("MM_NewKStack - Allocated %p", base + MM_KERNEL_STACK_SIZE);
791                 return base+MM_KERNEL_STACK_SIZE;
792         }
793         // No stacks left
794         Log_Warning("MMVirt", "MM_NewKStack - No address space left");
795         return 0;
796 }
797
798 /**
799  * \fn tVAddr MM_NewWorkerStack()
800  * \brief Creates a new worker stack
801  */
802 tVAddr MM_NewWorkerStack(Uint *StackContents, size_t ContentsSize)
803 {
804         Uint    base;
805         tPAddr  page;
806         
807         LOG("(StackContents=%p,ContentsSize=%i)", StackContents, ContentsSize);
808         // TODO: Thread safety
809         // Find a free worker stack address
810         for(base = giLastUsedWorker; base < NUM_WORKER_STACKS; base++)
811         {
812                 // Used block
813                 if( gWorkerStacks[base/32] == -1 ) {
814                         base += 31;     base &= ~31;
815                         base --;        // Counteracted by the base++
816                         continue;
817                 }
818                 // Used stack
819                 if( gWorkerStacks[base/32] & (1 << base) ) {
820                         continue;
821                 }
822                 break;
823         }
824         if(base >= NUM_WORKER_STACKS) {
825                 Log_Error("MMVirt", "Uh-oh! Out of worker stacks");
826                 return 0;
827         }
828         LOG("base=0x%x", base);
829         
830         // It's ours now!
831         gWorkerStacks[base/32] |= (1 << base);
832         // Make life easier for later calls
833         giLastUsedWorker = base;
834         // We have one
835         base = WORKER_STACKS + base * WORKER_STACK_SIZE;
836         //Log(" MM_NewWorkerStack: base = 0x%x", base);
837         LOG("base=%p (top)", base);
838         
839         // Set the temp fractals to TID0's address space
840         GET_TEMP_MAPPING( ((Uint)gaInitPageDir - KERNEL_BASE) );
841         INVLPG( gaTmpDir );
842         
843         // Check if the directory is mapped (we are assuming that the stacks
844         // will fit neatly in a directory)
845         LOG("gaTmpDir[ 0x%x ] = 0x%x", base>>22, gaTmpDir[ base >> 22 ]);
846         if(gaTmpDir[ base >> 22 ] == 0) {
847                 gaTmpDir[ base >> 22 ] = MM_AllocPhys() | 3;
848                 INVLPG( &gaTmpTable[ (base>>12) & ~0x3FF ] );
849         }
850         
851         // Mapping Time!
852         for( Uint addr = 0; addr < WORKER_STACK_SIZE; addr += 0x1000 )
853         {
854                 page = MM_AllocPhys();
855                 gaTmpTable[ (base + addr) >> 12 ] = page | 3;
856         }
857         LOG("mapped");
858
859         // Release temporary fractal
860         REL_TEMP_MAPPING();
861
862         // NOTE: Max of 1 page
863         // `page` is the last allocated page from the previious for loop
864         LOG("Mapping first page");
865         char    *tmpPage = MM_MapTemp( page );
866         LOG("tmpPage=%p", tmpPage);
867         memcpy( tmpPage + (0x1000 - ContentsSize), StackContents, ContentsSize);
868         MM_FreeTemp( tmpPage );
869         
870         //Log("MM_NewWorkerStack: RETURN 0x%x", base);
871         LOG("return %p", base+WORKER_STACK_SIZE);
872         return base + WORKER_STACK_SIZE;
873 }
874
875 /**
876  * \fn void MM_SetFlags(tVAddr VAddr, Uint Flags, Uint Mask)
877  * \brief Sets the flags on a page
878  */
879 void MM_SetFlags(volatile void *VAddr, Uint Flags, Uint Mask)
880 {
881         Uint    pagenum = (tVAddr)VAddr >> 12;
882         if( !(gaPageDir[pagenum >> 10] & 1) )   return ;
883         if( !(gaPageTable[pagenum] & 1) )       return ;
884         
885         tTabEnt *ent = &gaPageTable[pagenum];
886         
887         // Read-Only
888         if( Mask & MM_PFLAG_RO )
889         {
890                 if( Flags & MM_PFLAG_RO ) {
891                         *ent &= ~PF_WRITE;
892                 }
893                 else {
894                         gaPageDir[pagenum >> 10] |= PF_WRITE;
895                         *ent |= PF_WRITE;
896                 }
897         }
898         
899         // Kernel
900         if( Mask & MM_PFLAG_KERNEL )
901         {
902                 if( Flags & MM_PFLAG_KERNEL ) {
903                         *ent &= ~PF_USER;
904                 }
905                 else {
906                         gaPageDir[pagenum >> 10] |= PF_USER;
907                         *ent |= PF_USER;
908                 }
909         }
910         
911         // Copy-On-Write
912         if( Mask & MM_PFLAG_COW )
913         {
914                 if( Flags & MM_PFLAG_COW ) {
915                         *ent &= ~PF_WRITE;
916                         *ent |= PF_COW;
917                 }
918                 else {
919                         *ent &= ~PF_COW;
920                         *ent |= PF_WRITE;
921                 }
922         }
923         
924         //Log("MM_SetFlags: *ent = 0x%08x, gaPageDir[%i] = 0x%08x",
925         //      *ent, VAddr >> 22, gaPageDir[VAddr >> 22]);
926 }
927
928 /**
929  * \brief Get the flags on a page
930  */
931 Uint MM_GetFlags(volatile const void *VAddr)
932 {
933         Uint    pagenum = (tVAddr)VAddr >> 12;
934         
935         // Validity Check
936         if( !(gaPageDir[pagenum >> 10] & 1) )   return 0;
937         if( !(gaPageTable[pagenum] & 1) )       return 0;
938         
939         tTabEnt *ent = &gaPageTable[pagenum];
940         
941         Uint    ret = 0;
942         // Read-Only
943         if( !(*ent & PF_WRITE) )        ret |= MM_PFLAG_RO;
944         // Kernel
945         if( !(*ent & PF_USER) ) ret |= MM_PFLAG_KERNEL;
946         // Copy-On-Write
947         if( *ent & PF_COW )     ret |= MM_PFLAG_COW;
948         
949         return ret;
950 }
951
952 /**
953  * \brief Check if the provided buffer is valid
954  * \return Boolean valid
955  */
956 int MM_IsValidBuffer(tVAddr Addr, size_t Size)
957 {
958          int    bIsUser;
959          int    dir, tab;
960
961         Size += Addr & (PAGE_SIZE-1);
962         Addr &= ~(PAGE_SIZE-1);
963
964         dir = Addr >> 22;
965         tab = Addr >> 12;
966         
967 //      Debug("Addr = %p, Size = 0x%x, dir = %i, tab = %i", Addr, Size, dir, tab);
968
969         if( !(gaPageDir[dir] & 1) )     return 0;
970         if( !(gaPageTable[tab] & 1) )   return 0;
971         
972         bIsUser = !!(gaPageTable[tab] & PF_USER);
973
974         while( Size >= PAGE_SIZE )
975         {
976                 if( (tab & 1023) == 0 )
977                 {
978                         dir ++;
979                         if( !(gaPageDir[dir] & 1) )     return 0;
980                 }
981                 
982                 if( !(gaPageTable[tab] & 1) )   return 0;
983                 if( bIsUser && !(gaPageTable[tab] & PF_USER) )  return 0;
984
985                 tab ++;
986                 Size -= PAGE_SIZE;
987         }
988         return 1;
989 }
990
991 /**
992  * \fn tPAddr MM_DuplicatePage(tVAddr VAddr)
993  * \brief Duplicates a virtual page to a physical one
994  */
995 tPAddr MM_DuplicatePage(tVAddr VAddr)
996 {
997         tPAddr  ret;
998         void    *temp;
999          int    wasRO = 0;
1000         
1001         //ENTER("xVAddr", VAddr);
1002         
1003         // Check if mapped
1004         if( !(gaPageDir  [VAddr >> 22] & PF_PRESENT) )  return 0;
1005         if( !(gaPageTable[VAddr >> 12] & PF_PRESENT) )  return 0;
1006         
1007         // Page Align
1008         VAddr &= ~0xFFF;
1009         
1010         // Allocate new page
1011         ret = MM_AllocPhys();
1012         if( !ret ) {
1013                 return 0;
1014         }
1015         
1016         // Write-lock the page (to keep data constistent), saving its R/W state
1017         wasRO = (gaPageTable[VAddr >> 12] & PF_WRITE ? 0 : 1);
1018         gaPageTable[VAddr >> 12] &= ~PF_WRITE;
1019         INVLPG( VAddr );
1020         
1021         // Copy Data
1022         temp = MM_MapTemp(ret);
1023         memcpy( temp, (void*)VAddr, 0x1000 );
1024         MM_FreeTemp(temp);
1025         
1026         // Restore Writeable status
1027         if(!wasRO)      gaPageTable[VAddr >> 12] |= PF_WRITE;
1028         INVLPG(VAddr);
1029         
1030         //LEAVE('X', ret);
1031         return ret;
1032 }
1033
1034 /**
1035  * \fn Uint MM_MapTemp(tPAddr PAddr)
1036  * \brief Create a temporary memory mapping
1037  * \todo Show Luigi Barone (C Lecturer) and see what he thinks
1038  */
1039 void *MM_MapTemp(tPAddr PAddr)
1040 {
1041         ENTER("PPAddr", PAddr);
1042         
1043         PAddr &= ~0xFFF;
1044         
1045         if( Semaphore_Wait(&gTempMappingsSem, 1) != 1 )
1046                 return NULL;
1047         LOG("Semaphore good");
1048         Mutex_Acquire( &glTempMappings );
1049         for( int i = 0; i < NUM_TEMP_PAGES; i ++ )
1050         {
1051                 Uint32  *pte = &gaPageTable[ (TEMP_MAP_ADDR >> 12) + i ];
1052                 LOG("%i: %x", i, *pte);
1053                 // Check if page used
1054                 if(*pte & 1)    continue;
1055                 // Mark as used
1056                 *pte = PAddr | 3;
1057                 INVLPG( TEMP_MAP_ADDR + (i << 12) );
1058                 LEAVE('p', TEMP_MAP_ADDR + (i << 12));
1059                 Mutex_Release( &glTempMappings );
1060                 return (void*)( TEMP_MAP_ADDR + (i << 12) );
1061         }
1062         Mutex_Release( &glTempMappings );
1063         Log_KernelPanic("MMVirt", "Semaphore suplied a mapping, but none are avaliable");
1064         return NULL;
1065 }
1066
1067 /**
1068  * \fn void MM_FreeTemp(tVAddr PAddr)
1069  * \brief Free's a temp mapping
1070  */
1071 void MM_FreeTemp(void *VAddr)
1072 {
1073          int    i = (tVAddr)VAddr >> 12;
1074         //ENTER("xVAddr", VAddr);
1075         
1076         if(i >= (TEMP_MAP_ADDR >> 12)) {
1077                 gaPageTable[ i ] = 0;
1078                 Semaphore_Signal(&gTempMappingsSem, 1);
1079         }
1080         
1081         //LEAVE('-');
1082 }
1083
1084 /**
1085  * \fn tVAddr MM_MapHWPages(tPAddr PAddr, Uint Number)
1086  * \brief Allocates a contigous number of pages
1087  */
1088 void *MM_MapHWPages(tPAddr PAddr, Uint Number)
1089 {
1090          int    j;
1091         
1092         PAddr &= ~0xFFF;
1093
1094         if( PAddr < 1024*1024 && (1024*1024-PAddr) >= Number * PAGE_SIZE )
1095         {
1096                 return (void*)(KERNEL_BASE + PAddr);
1097         }
1098
1099         // Scan List
1100         for( int i = 0; i < NUM_HW_PAGES; i ++ )
1101         {               
1102                 // Check if addr used
1103                 if( gaPageTable[ (HW_MAP_ADDR >> 12) + i ] & 1 )
1104                         continue;
1105                 
1106                 // Check possible region
1107                 for( j = 0; j < Number && i + j < NUM_HW_PAGES; j ++ )
1108                 {
1109                         // If there is an allocated page in the region we are testing, break
1110                         if( gaPageTable[ (HW_MAP_ADDR >> 12) + i + j ] & 1 )    break;
1111                 }
1112                 // Is it all free?
1113                 if( j == Number )
1114                 {
1115                         // Allocate
1116                         for( j = 0; j < Number; j++ ) {
1117                                 MM_RefPhys( PAddr + (j<<12) );
1118                                 gaPageTable[ (HW_MAP_ADDR >> 12) + i + j ] = (PAddr + (j<<12)) | 3;
1119                         }
1120                         return (void*)(HW_MAP_ADDR + (i<<12));
1121                 }
1122         }
1123         // If we don't find any, return NULL
1124         return 0;
1125 }
1126
1127 /**
1128  * \fn tVAddr MM_AllocDMA(int Pages, int MaxBits, tPAddr *PhysAddr)
1129  * \brief Allocates DMA physical memory
1130  * \param Pages Number of pages required
1131  * \param MaxBits       Maximum number of bits the physical address can have
1132  * \param PhysAddr      Pointer to the location to place the physical address allocated
1133  * \return Virtual address allocate
1134  */
1135 void *MM_AllocDMA(int Pages, int MaxBits, tPAddr *PhysAddr)
1136 {
1137         tPAddr  phys;
1138         void    *ret;
1139         
1140         ENTER("iPages iMaxBits pPhysAddr", Pages, MaxBits, PhysAddr);
1141         
1142         if(MaxBits == -1)
1143                 MaxBits = PHYS_BITS;
1144         
1145         // Sanity Check
1146         if(MaxBits < 12) {
1147                 LEAVE('i', 0);
1148                 return 0;
1149         }
1150         
1151         // Fast Allocate
1152         if(Pages == 1 && MaxBits >= PHYS_BITS)
1153         {
1154                 phys = MM_AllocPhys();
1155                 if( PhysAddr )
1156                         *PhysAddr = phys;
1157                 if( !phys ) {
1158                         LEAVE_RET('i', 0);
1159                 }
1160                 ret = MM_MapHWPages(phys, 1);
1161                 if(ret == 0) {
1162                         MM_DerefPhys(phys);
1163                         LEAVE('i', 0);
1164                         return 0;
1165                 }
1166                 LEAVE('x', ret);
1167                 return (void*)ret;
1168         }
1169         
1170         // Slow Allocate
1171         phys = MM_AllocPhysRange(Pages, MaxBits);
1172         // - Was it allocated?
1173         if(phys == 0) {
1174                 LEAVE('i', 0);
1175                 return 0;
1176         }
1177         
1178         // Allocated successfully, now map
1179         ret = MM_MapHWPages(phys, Pages);
1180         // - MapHWPages references the memory, so release references
1181         for( int i = 0; i < Pages; i ++ )
1182                 MM_DerefPhys(phys + i*PAGE_SIZE);
1183         if( ret == 0 ) {
1184                 LEAVE('i', 0);
1185                 return 0;
1186         }
1187         
1188         if( PhysAddr )
1189                 *PhysAddr = phys;
1190         LEAVE('x', ret);
1191         return (void*)ret;
1192 }
1193
1194 /**
1195  * \fn void MM_UnmapHWPages(tVAddr VAddr, Uint Number)
1196  * \brief Unmap a hardware page
1197  */
1198 void MM_UnmapHWPages(volatile void *Base, Uint Number)
1199 {
1200         tVAddr  VAddr = (tVAddr)Base;
1201         //Log_Debug("VirtMem", "MM_UnmapHWPages: (VAddr=0x%08x, Number=%i)", VAddr, Number);
1202
1203         //
1204         if( KERNEL_BASE <= VAddr && VAddr < KERNEL_BASE + 1024*1024 )
1205                 return ;
1206         
1207         Uint pagenum = VAddr >> 12;
1208
1209         // Sanity Check
1210         if(VAddr < HW_MAP_ADDR || VAddr+Number*0x1000 > HW_MAP_MAX)     return;
1211         
1212         
1213         Mutex_Acquire( &glTempMappings );       // Temp and HW share a directory, so they share a lock
1214         
1215         for( Uint i = 0; i < Number; i ++ )
1216         {
1217                 MM_DerefPhys( gaPageTable[ pagenum + i ] & ~0xFFF );
1218                 gaPageTable[ pagenum + i ] = 0;
1219                 INVLPG( (tVAddr)(pagenum + i) << 12 );
1220         }
1221         
1222         Mutex_Release( &glTempMappings );
1223 }
1224

UCC git Repository :: git.ucc.asn.au